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出版说明 


由香港科技大学社会科学部吴晓刚教授主编的“格致方 
法 • 定量研究系列”丛书，精选了世界著名的 SAGE 出版社 
定量社会科学研究丛书中的35种，翻译成中文，集结成八 
册，于2011年出版。这八册书分 别是： 《线性回归分析基 
础》、《高级回归分析》、《广义线性模型》、《纵贯数据分析》、 
《因果关系模型》、《社会科学中的数理基础及应用》、《数据分 
析方法五种》和《列表数据分析》。这套丛书自出版以来，受 
到广大读者特别是年轻一代社会科学工作者的欢迎，他们针 
对丛书的内容和翻译都提出了很多中肯的建议。我们对此 
表示衷心的感谢。 

基于读者的热 B 馕 iMPl 堪湖了向广大读者提供更多 
的方便和选择，我像稱核遂务的形式再次出版发行。 
在此过程中，主编带暇 T 对& WifWI 书做了必要的修订和校 
正，还新增加了两个品种。此外，罾东林、许多多、范新光、李 
忠路协助主编参加了校订。今后我们将继续与 SAGE 出版社 
合作，陆续推出新的品种。我们希望本丛书单行本的出版能 
为推动国内社会科学定量研究的教学和研究作出一点贡献。 



往事如烟，光阴如梭。转眼间，出国已然十年有余。 
1996年赴美留学，最初选择的主攻方向是比较历史社会学， 
研究的兴趣是中国的制度变迁问题。以我以前在国内所受 
的学术训练，基本是看不上定量研究的。一方面，我们倾向 
于研究大问题，不喜欢纠缠于细枝末节。国内一位老师的 
话给我的印象很深，大致是说 :如果 你看到一堵墙就要倒 
了，还用得着纠缠于那堵墙的倾斜角度究竟是几度吗？所 
以，很多研究都是大而化之，只要说得通即可。另一方面， 
国内（十年前）的统计教学，总的来说与社会研究中的实际 
问题是相脱节的。结果是，很多原先对定量研究感兴趣的 
学生在学完统计之后，依旧无从下手，逐渐失去了对定量研 
究的兴趣。 

我所就读的美国加州大学洛杉矶分校社会学系，在定量 
研究方面有着系统的博士训练课程。不论研究兴趣是定量 
还是定性的，所有的研究生第一年的头两个学期必须修两门 
中级统计课，最后一个学期的系列课程则是简单介绍线性回 
归以外的其他统计方法，是选修课。希望进一步学习定量研 
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究方法的可以在第二年修读另外一个三学期的系列课程，其 
中头两门课叫“调查数据分析”，第三门叫“研究设计”。除此 
以外，还有如“定类数据分析”、“人口学方法与技术”、“事件 
史分析”、“多层线性模型”等专门课程供学生选修。该学校 
的统计系、心理系、教育系、经济系也有一批蜚声国际的学 
者，提供不同的、更加专业化的课程供学生选修。2001年完 
成博士学业之后，我又受安德鲁 • 梅隆基金会资助，在世界 
定量社会科学研究的重镇密歇根大学从事两年的博士后研 
究，其间旁听谢宇教授为博士生讲授的统计课程，并参与该 
校社会研究院 (Institute for Social Research ) 定量社会研究方 
法项目的一些讨论会，受益良多。 

2003年，我赴港工作，在香港科技大学社会科学部，教授 
研究生的两门核心定量方法课程。香港科技大学社会科学 
部自创建以来，非常重视社会科学研究方法论的训练。我开 
设的第一门课“社会科学里的统计学 ” （Statistics for Social 
Science ) 为所有研究型硕士生和博士生的必修课，而第二门 
课“社会科学中的定量分析”为博士生的必修课（事实上，大 
部分硕士生在修完第一门课后都会继续选修第二门课）。我 
在讲授这两门课的时候，根据社会科学研究生的数理基础比 
较薄弱的特点，尽量避免复杂的数学公式推导，而用具体的 
岡子，结合语言和图形，帮助学生理解统计的基本概念和模 
型。课程的重点放在如何应用定量分析模型研究社会实际 
问题上，即社会研究者主要为定量统计方法的“消费者”而非 
“生产者”。作为“消费者”，学完这些课程后，我们一方面能 
够读懂、欣赏和评价别人在同行评议的刊物上发表的定量研 
究的 文章; 另一方面，也能在自己的研究中运用这些成熟的 



方法论技术。 

上述两门课的内容，尽管在线性回归模型的内容上有 
少量重复，但各有侧重。“社会科学里的统计学 ” （Statistics 
for Social Science ) 从介绍最基本的社会研究方法论和统计 
学原理开始，到多元线性回归模型结束，内容涵盖了描述性 
统计的基本方法、统计推论的原理、假设检验、列联表分析、 
方差和协方差分析、简单线性回归模型、多元线性回归模 
型，以及线性回归模型的假设和模型诊断。“社会科学中 
的定量分析”则介绍在经典线性回归模型的假设不成立的 
情况下的一些模型和方法，将重点放在因变量为定类数据 
的分析模型上，包括两分类的 logistic 回归模型、多分类 lo ¬ 
gistic 回归模型、定序 logistic 回归模型、条件 logistic 回归模 
型、多维列联表的对数线性和对数乘积模型、有关删节数据 
的模型、纵贯数据的分析模型，包括追踪研究和事件史的分 
析方法。这些模型在社会科学研究中有着更加广泛的 
应用。 

修读过这些课程的香港科技大学的研究生，一直鼓励 
和支持我将两门课的讲稿结集出版，并帮助我将原来的英 
文课程讲稿译成了中文。但是，由于种种原因，这两本书拖 
了四年多还没有完成。世界著名的出版社 SAGE 的“定量 
社会科学研究”丛书闻名遐迩，每本书都写得通俗易懂。中 
山大学马骏教授向格致出版社何元龙社长推荐了这套书， 
当格致出版社向我提岀从这套丛书中精选一批翻译，以獪 
中文读者时，我非常支持这个想法，因为这从某种程度上弥 
补了我的教科书未能出版的遗憾。 

翻译是一件吃力不讨好的事。不但要有对中英文两种 




4 


logit 与 prabit : 次序横型和多类别槿型 


语言的精准把握能力，还要有对实质内容有较深的理解能 
力，而这套丛书涵盖的又恰恰是社会科学中技术性非常强 
的内容，只有语言能力是远远不能胜任的。在短短的一年 
时间里，我们组织了来自中国内地及港台地区的二十几位 
研究生参与了这项工程，他们目前大部分是香港科技大学 
的硕士和博士研究生，受过严格的社会科学统计方法的训 
练，也有来自美国等地对定量研究感兴趣的博士研究生。 
他 们是： 

香港科技大学社会科学部博士研究生蒋勤、李骏、盛智 
明、叶华、张卓妮、郑冰岛，硕士研究生贺光烨、李兰、林毓玲、 
肖东亮、辛济云、於嘉、余珊珊，应用社会经济研究中心研究 
员李 俊秀; 香港大学教育学院博士研究生洪 岩璧; 北京大学 
社会学系博士研究生李丁、赵 亮员； 中国人民大学人口学系 
讲师巫锡炜冲国台湾“中央”研究院社会学所助理研究员林 
宗弘; 南京师范大学心理学系副教授 陈陈; 美国北卡罗来纳 
大学教堂山分校社会学系博士候选人姜 念涛; 美国加州大学 
洛杉矶分校社会学系博士研究生宋曦。 

关于每一位译者的学术背景，书中相关部分都有简单 
的介绍。尽管每本书因本身内容和译者的行文风格有所差 
异，校对也未免挂一漏万，术语的标准译法方面还有很大的 
改进空间，但所有的参与者都做了最大的努力，在繁忙的学 
习和研究之余，在不到一年的时间内，完成了三十五本书、 
超过百万字的翻译任务。李骏、叶华、张卓妮、贺光烨、宋 
曦、於嘉、郑冰岛和林宗弘除了承担自己的翻译任务之外， 
还在初稿校对方面付出了大量的劳动。香港科技大学霍英 
东南沙研究院的工作人员曾东林，协助我通读了全稿，在此 



我也致以诚挚的谢意。有些作者，如香港科技大学黄善国 
教授、美国约翰 • 霍普金斯大学郝令昕教授，也参与了审校 
工作。 

我们希望本丛书的出版，能为建设国内社会科学定量研 
究的扎实学风作出一点贡献。 


吴晓刚 

于香港九龙清水湾 
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要使普通最小二乘法 （ OLS ) 产生最优线性无偏估计 
( BLUE ), 必须符合经典回归假设。这些假设中有些假设比 
其他假设更容易实现。此外，违反这些假设的实际后果因假 
设的不同而不同。其中一个假设难以实现，而且会对 OLS 的 
解释造成严重后果，那就是假设因变量是连续的。相反，如 
果因变量是离散的，即由两个或更多的结果类别构成，那么 
OLS 就会产生严重的推论问题。在这种情况下，最大似然 
(maximum likelihood ) 技术如 logit 或 probit 通常更有效。 

本书比较独特，因为它完全致力于分析当因变量具多类 
别时的估计情况。在概论之后，作者关注了具离散和次序形 
式的因变量。比如，假设某位政治科学家有选举调查的数 
据，并希望解释政治兴趣这一因变量，其中受访者的得分： 0 
=低，1 =中等，2 =高。这个变量是离散的，受访者处于这三 
种类别中的一种。此外，这个变量是从“低”到“高”排序的。 
在这种有序变量情况下，我们可以说某个得分为“高”的人比 
某个得分为“低”的人具有更多的政治兴趣，但我们不能确切 
地说多多少。所以， OLS 回归看起来较不可取，而次序 logit 
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或次序 probit 更可取，因为它们适合这种较低的测量水平。 
布鲁雅 ( Borooah ) 教授详尽地阐释了这两种方法，试图解释 
社会剥夺(用三个_别测量，“没有被剥夺”、“轻度被剥夺”、 
“严重被剥夺”）在不同个体间的差异。一个经常出现的问题 
是 logit 是否比 probit 更优，或者反之。这两种方法根本上的 
理论差异涉及误差项的分布是逻辑分布还是正态分布。实 
际上，正如本书指出的，我们很难提供足够的理由说明为什 
么选择其中一种方法而非另外一种。 

本书还把处理对象扩展到具两个以上结果的多类别或 
非次序因变量。比如，宗教的选择、住宅区的选择、购物中心 
的选择、工作的选择等。多类别 logit 的一个关键假设是无关 
选项独立性 ( IIA )。 正如布鲁雅教授所论述的，这个假设既 
是此技术的优点又是其缺点。他还对比数比 （ odds - ratios ) 和 
风险比 ( risk - ratios ) 做了重要但往往被忽视的区分。在二分 
类 logit 中，这两种比率之间没有差异，但是，在多类别 logit 
中，结果是以风险比的方式显 示的。 

本书结尾给出了非常有用的计算机程序详情，用于说明 
书中的表格结果是如何产生的。这种逐步对计算机程序进 
行注释的方式让读者明白如何运行数据分析。讲解中具体 
使用的软件是 STATA ， 但作者还指出了 SAS , SPSS 和 LIM - 
DEP 中其他可用的程序。总体而言，这本书为估计和解释从 
更复杂的离散因变量模型中得到的结果提供了一个有用的 
指南。 


迈克尔.刘易斯-贝克 
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戏剧评论家肯尼思 • 泰南 (Kenneth Tynan ) 曾出色地描 
述过他的 职业： 由“知道路线，但是不知道怎么开车”的人组 
成。社会科学研究者经常发现自己处于类似的情形之中。 
有些人能在研究蓝图中定位，却不知如何从一个地方到另一 
个地方。其他人可以在研究中驱车前进却无法超越固定的 
路线。只有少数幸运的人既能导航又能飞行。对这种现象 
的察觉界定了本书的大概意图：（1)探寻穿越次序和多类别 
logit 模型“地形”的主要 路径； （2) 为在这些路径中驱车前进 
提供指引。但首先，在发动机器之前，我们先对其简单介绍 
一下。 

很多时候，适合我们分析的变量仅仅只是对定性结果的 
一种编码。这些模型就是定性选择模型。举例来说，在评判 
某种政府行为时，一个人非常赞成(编码=1)，赞成(编码= 
2)，反对(编码= 3)，或者强烈反对(编码= 4); 或者一个人 
投自由党的票(编码= 1) ，投保守党的票(编码= 2) ，或者工 
党的票(编码= 3)。在这种情形之下，因变量取的是一组离 
散的、互斥的、完全穷尽的值。这与其他至少在理论上假设 
因变量的取值是连续数值的情况不同。虽然传统的回归方 
法不适合离散因变量的统计分析，但是我们可以用回归分析 
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的原理，建立把观察到的结果与特定“决定性的”或“解释性 
的”变量连接起来的模型。因变量取值大于两个的定性选择 
模型为多元结果模型。我们还可以进一步把多元结果划分 
为:次 序结果(如前述对政府行为的赞成程度的例子)和非次 
序结果(如前述投票的例子）。 

定性选择模型在应用计量经济学分析中已经很普遍。 
社会科学家也一直对在互斥的选项中进行选择的问题感兴 
趣。越来越多可利用的调査数据（横截面或面板格式）意味 
着越来越多的学者可以把他们的知识思索转变成实实在在 
的成果。学者们带着一系列具体的问题从这些数据中寻找 
答案。然后，当分析完这些数据之后，结果往往隐藏在关于 
什么才是“正确”答案的不确定性之中。为了改善这种状况， 
必须对教科书技术进行巧妙的处理，以使推导出的结果明确 
地指向正确的方向。本章在社会经济不平等相关问题的背 
景之下，讨论了对多元结果模型一包括次序和非次序结 
果——的估计、模拟和解释。 

次序和非次序模型对各自的分析有不同的技术要求。 
次序模型可以由 logit 方法即次序 logit 模型，或者 probit 方 
法即次序 probit 模型进行估计。非次序结果模型由 logit 方 
法估计最方便，虽然原则上用 probit 的方法也可以对这种模 
型进行估计，但是由于计算方面的原因，常常并不可行。因 
此，非次序多元结果模型被称为多类别 logit 模型。 

多类别 logit 模型可以是有条件的，就是说在不同选项之 
间进行的选择不仅仅取决于做决定的个人所具有的特征，同 
时还取决于选项本身的属性。举个例子，个人选择惠顾哪个 
购物中心可能取决于购物中心本身的属性(商店的数量与种 



4 


logit 与 probit : 次序模型和多类别横型 


类，中心的保养标准），这一属性并不随个人情况 而变； 同时 
也取决于收人和家庭大小，这些随个人而变。一个更复杂的 
因素是个人特征和选项属性之间还可能互相影 响:对 购物中 
心的选择可能决定于个人从居住地（居住地属于个人的特 
征)到某个特定的购物中心（购物中心的位置属于选项的属 
性)的 距离。 次序模型将在第2章中论述，多类别模型将在 
第3章中论述，这两章具有两个共同的目的： （1) 介绍这些模 
型的基本方 法论； （2) 阐述在社会科学研究中如何运用这些 
模型。 

满足第一个目的需要在过度单纯化与过分技术性之间 
寻找一个平衡点。作者已经尝试着找到这种平衡。然而，为 
了减轻负担，作者假设读者已经掌握了足够的知识。其中， 
这些知识 包括： 

(1) 了解线性概率模型的不足之处，或者为什么普通的 
回归分析并不适用于具离散因变量的模型。 

(2) 熟悉因变量只有两个可能结果时的 logit 和 probit 
方法。 

关于以上这两点，这个系列里奥尔德里奇和纳尔逊 
(Aldrich &- Nelson , 1984) 、德马里斯 （ DeMaris ， 1992)、廖 
( Liao , I " 4 )和梅纳德 （ Menard , 1995) 等人的专著，以及更 
具概括性的计量经济学教材如格林 ( Greene )2000 年的著作， 
提供了非常好的综述。 

满足第二个目的在作者看来更加困难。对一个模型的 
运用需要好几个认识层次。首先，我们必须非常清楚要提的 
问题。其次，如何回答它们也是一个问题。通常 ，一 个特定 
的研究问题可以用不止一种方法来回答，所以知道这些不同 
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的方法怎么不同，为什么不同，以及眼前什么方法可能是最 
好的方法就很重要。最后，当我们已经决定了要提的问题以 
及怎么回答它们，就要处理另一个实践问题即如何通过取得 
并解释分析结果来执行我们的研究策略。 

作者已经尝试着解决这些议题，即在次序 logit 和 prob - 
it , 以及多类别 logit 模型的框架中采取一个三重策略。第 
一 ，作者尽可能把方法论和经验分析结合起来。几乎每一章 
的理论总结都可在随后的应用内容中找到对应的分析。 

第二，作者试图用两个固定的应用项目来进行阐释。这 
样做是因为作者觉得用一个单一的经验(“真实世界”)线索 
贯穿全章比用相互脱节的例子分开阐释更有利于说明模型 
的应用。 

第2章次序 logit 和 probit 以对社会剥夺状态的经验分 
析为基础。这个项目使用的数据来自北爱尔兰对将近14000 
个人进行的调查，该调查的主要内容是社会剥夺的根源以及 
天主教徒与新教徒之间被剥夺经历的不平等状况。第3章 
多类别 logit 模型基于对英国少数民族的职业获得的经验研 
究。这个项目使用的数据来自英国对将近10万全职男性雇 
员进行的普查，旨在研究黑加勒比人、印第安人和白人获得 
各种职业类别的不同机会。 

第三，最后一章列举了用于产生经验结果的完整的电脑 
程序清单。据作者所知，至少有四种众所周知的具高度好评 
的软件，这些软件除了能解决其他方面的问题，还很适用于 
解决与本书的讨论内容类似的 问题: SAS , SPSS vlO . 0( 印第 
安纳大学统计与数学计算中心为在次序与非次序结果事件 
的分析中应用 SAS 和 SPSS 提供了很好的人门课程 W )， 
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LIMDEPCGreene , 1995) 以及 STATA ( STATA , 1999)。 由 
于 作者对 STATA 比较熟悉，因此第 4 章中的程序均用 
STATA 编写。 几乎每一行命令都附有一个注解，以说明这 
些命令应起的作用以及其如何与前面章节中的材料相关。 



次序模型 
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第1节 I 简介 




假设有 N 个人(标号为 f = 1，…， N )， 每个人都会发生 
一 个“事件”。假设这个事件有 M > 2种结果，标号为 J = 
1，…， M ， 这些结果是相互排斥且完全穷尽的。令变量 K 
取的值代表第/个人的 结果： = 1表示这个人出现了第一 
种结果 U = 1) = 2表示这个人出现了第二种结果 G = 
2), 如此这般，直至 Y , = M 表示出现最后一种结果 （j = 
M )。 进一步假设这些结果在本质上就是次序的，意味着与变 
量更高的取值相关的结果比取值更低的结果排序更高。 
或者说，因变量 y , 与有序的结果相关:“更强的”结果与因变 
量更高的值联系在一起。但是，这些结果序号间的差异并不 
表示它们在程度上的 差异； == 2的结果并不是 y , = 1的结 
果的两倍强度。因此，一个有序因变量的实际取值之间是不 
相关的，它只意味着更大的取值对应于更强的 结果： 我们可 
以令= 5表示发生了第一种结果，令 Y , = 7表示发生了第 
二种结果，以此类推。 

一个人的健康状况是次序结果的例子。“差”、“良好”以 
及“非常好”的健康状况可以用一个取值分别为1，2和3的 
变量表示。在这个例子中， Y , = 3( 健康状况非常好)表示其 
结果比 y , = 2( 健康状况良好)更好，依次，后者又比 y , = 1 
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(健康状况差)更好。其他次序结果的例子，如个人的保险范 
围(没有、半保、全保），或者处于工作年龄的个人之雇佣状况 
(不从事经济活动、失业、雇员）。而个人的宗教信仰则为非 
次序变量的例子，如 V , = 1表示新教徒 ， K = 2表示犹太教 
徒， Y , = 3表示穆斯林，= 4表示印第安教徒。虽然此例 
中的这些结果都不一样，但是它们却不可以排序，因此不能 
被视为有序结果。换一种方式说，这个表示宗教信仰的因变 
量是非次序的。 

当结果明显具有次序的时候，我们必须注 意：因 变量既 
是离散的又是有序的。例如，若结果被编码为1，2, 3,线性 
回归就会把3与2之间的差异与2与1之间的差异同等对 
待，但其实这些数字其实只是一种排列方式而并没有什么重 
要意义。另一方面，用多类别 logit 的方法对一个有序因变量 
进行计量经济学关系的估计，则意味着这些数据的次序性所 
传达的信息被舍弃掉了。因此，用于估计因变量多于两个结 
果 [2] 且这些结果同时是离散的又是有序的模型，最常用且适 
当的方法就是次序 logit 和次序 probit 的方法 [3] 。 

但是，以上所述受限于一个重要的附加说明。次序 logit 
和 probit 的一个关键假设是平行斜率假设。这个假设的含 
义将在后面进行详细的讨论，但大体上，它的意思是如果有 
一个变量影响了一个人处于这些次序类别中的某一个结果 
的可能性(如饮食对健康状况的影响），就假定这个变量与结 
果间相关联的系数对所有的结果是一样的(特定的饮食对一 
个人处于非常好的健康状况的可能性的影响与对他/她处于 
差的健康状况的可能性的影响是一模一样的）。如果这个假 
设不成立， S 卩，与某一特定变量相关联的斜率系数对不同的 
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结果是不一样的(特定的饮食对一个人处于非常好的健康状 
况的可能性的影响不同于对他/她处于差的健康状况的可能 
性的影响），那么次序 logit 和 probit 的方法就不再适当，这种 
模型就应该用多类别 logit 的方法。 

我们并不是总能明确断定结果是有序的(还是无序的）， 
这是另外一个需要谨慎使用次序估计方法的原因。例如 ，一 
个人居住于城市的哪个位置（北边，南边，东边或者西边）表 
面上看是一个非有序的变量。但是如果我们知道城市的某 
些位置相比其他位置具有更健康的居住条件,那么界定个人 
居住位置的变量就需要有序的内涵，比如，住在北边 （ Y , = 
4) 比住在南边 ( Y , =3) 要好。但是，当并不确定某个变量是 
次序的还是非次序的时候，一个明智的选择是把它当成非次 
序的来对待，并用多类别 logit 的方法对以它为因变量的模型 
进行估计。这个准则是切合实际的，因为如果把一个事实上 
是非次序的结果变量当成次序的来对待，就给这些其实无序 
的结果强加了一个排序并提出了平行斜率(参考上文，并于 
下文有详细讨论）的限制性假设，而这样很可能会使估计发 
生偏差。另一方面，如果把次序结果变量当成非次序的，未 
能对这些结果给予合理的排序，会损失估计的效率，但却不 
可能使估计发生偏差。在这两种可能出现的错误之中，效率 
的损失与有偏的估计相比并不那么严重。 

这种不确定性的另一个例子，同时也是下一章多类别 
logit 中的应用实例，是个人的职业。一个人从事的职业是非 
技术的、半技术的还是技 术的； 以及其工作是专业类别还是 
管理类别，都可以看做是一种个人选择，尽管影响这个选择 
的限制条件可能因人而异且尤其随种族和/或性别而改变。 
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在解释这种选择的时候，职业结果可以看做是“非次序的”， 
意即一种职业类别相比另一种职业类别并非固有地更理想 
或更不理想。对于这种解释，分析职业结果的适当的估计方 
法是多类别 logit。 其实，这正是施米特和斯特劳斯 （Schmid 
&• Strauss, 1975) 对1000个人进行关于教育、经验、种族和 
性别的职业分析时所采用的方法。这种方法后来在格林 
(Greene, 2000: 859) 讨论多类别 logit 时作为例子被应用。 

从另一方面来说，假如一个大学教授被问及他/她更喜 
欢一个银行家还是一个看门人作为他/她的女婿，那个教授 
更可能会选择前者。在表达这种偏好时，这个教授暗中对职 
业进行了排序，把银行家排在了比看门人更高的层次（选择 
了更理想的女婿）。但是，重点是这种排序纯粹是主观的 [4] 
(即银行家与看门人相比并不是固有地更理想），而且附带 
地，那个教授对于他/她的女婿应该健康而非不健康的偏好 
并不具备客观性。这个故事的寓意在于，我们最好把结果当 
成是非次序的来对待，除非有好的理由对这些结果强加一种 
排序。[ 5] 
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第2节 | 方法论 


用一个具体的例子来说明次序 logit 和 probit 模型的方 
法论及其根本逻辑可能是最好的办法。假设有 n 个人(标号 
为 i=l， …， N), 住在一个地区，且每个人的“社会剥夺程 
度” (degree of deprivation) 可以用变量 £),• 的取值来表示，且 
A 越高的取值代表越高的剥夺程度。对某个特定个人赋予 
的“剥夺指数” (deprivation index) 假设值一此后称做他/她 
的“剥夺分数”一取决于这个人既有的多种因素。 

这些因素举例来说可能包括失业、单亲家庭及居住于某 
一特定区域。假设剥夺指数 A， 是 K 个因素（决定变量）的 
一个线性函数，这 K 个因素的取值对于个人 i 来说，为 X 4 , 
是=1，…， K。 这意味着剥夺指数可以表 示为： 


D , = =2,+ e , [2.1] 

/b = l 

其中，体是与第 6 个变量 G = 1，…， K) 相关的系数， 
Z, 。如果戽 > 0,对某个特定的个人第6个因 

素取值的增加会导致他/她剥夺分数的上升，反之体 < 0会 
导致分数的下降。但是，因为剥夺分数与导致剥夺的因素之 
间的关系并不精确——例如，可能有些因素并不包括在方程 
内或者有些因素的测量并不准确一所以此方程还包括了 
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一个误差项£,，用以捕捉这种不精确性。 

方程 2. 1存在的问题是，用 A 的取值所表示的真实的 
个人剥夺状态的精确图案是很难观察到的。剥夺指数是一 
个潜在变量，（虽然在概念上有用)但在原则上和实践上都难 
以察觉，方程 2. 1是一个潜在回归，按照现在的情况来看是 
无法进行估计的。 

但是，我们能观察到的是一个人被剥夺的程度 （ depriva ¬ 
tion level ) —例如一个人可以被归类为“没有被剥夺”、“轻 
度被剥夺”或“严重被剥夺”——而且变量可以以下列方 
式与这些剥夺程度相关联， Y , = 1如果此人没有被剥夺， 
V , =2如果此人轻度被剥夺，= 3如果此人严重被剥夺。 
按照前面的讨论， Y ; 是一个有序变量。样本中个人在这三个 
剥夺程度中的分类内在地基于潜在变量 A 的值以及“临界” 
值次和&，如下 所示： 

= 1，如果 D ; <次 

Y , = 2， 如果次 < A < & [2.2] 

Yi = 3 ，如果 D ; > 衣 

方程 2. 2 中的次，衣 > 0,是跟方程 2. 1中的戽一起有 
待估计的未知参数 (ft <&)。一个人在剥夺程度上的归类 
取决于他/她的剥夺分数 A 是否跨过某个临界值。取值 
为1，2和3的概率表示 如下： 

Pr(Y, = 1) = PKZ + e , < 在） = Prfe d—Z) 

Pr(Yi = 2) =Prtft <Z ； +e, = Pr( 戌一 2 ； <e,_ <4 —Z；) [2. 3] 

Pr(Y, = 3) = PKZj +£, >&)= Pr(e, >& — 乙） 

iV 个观察中的每一次都被视为多项分布中的一次单一 
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的抽取，在这种情况下，这个多项分布有三种结果，没有被剥 
夺、轻度被剥夺或严重被剥夺。 假设 N 个人，其中凡 个人 
没有被剥夺， N 2 个人轻度被剥夺， N 3 个人严重被剥夺。那 
么观察到现在这个样本的可能性，就是个体观察值概率的乘 
积 ，为： 

L = [ Pr ( Y , = 1)] N ' [ Pr ( y , = 2)]~' [ Pr ( Y , = 3)] N - 
=[ F (5, - Z ,)] N ' [ FC ^- Z . O - FW , - Z ^ T ' 

X [ l - F ( ft - Z ,)] N - [2.4] 

其中， F ( x )= Pr ( e , < x ) 是误差项的累积概率分布。如 
果我们已知误差项的概率分布——即我们知道什么是 F 
U ) ——那么我们就可以像译，5,，和&的估计值一样，选择 
那些使观察到样本结果的可能性最大化的值 [7] 。若缺乏这 
样的信息，我们可以假定误差项服从一个特定的概率分布。 

次序 logit 与次序 probit 模型之间的差别在于 :方程 2. 1 
中的误差项 e , 的(假定的)分布不同。次序 logit 模型是假定 
e , 具逻辑分布，而次序 probit 模型则假定 e , 具正态分布。很 
自然地，我们会问哪种分布更适合。 [8] 逻辑分布除了在末尾 
部分比正态分布大很多之外，其他与正态分布相似。 [9] 正如 
格林 (2000:815) 指 岀的： “要在理论上证明选择一种而非另 
一种分布更为合理是很困难的事……在大部分应用中，（它 
们)看起来并没有什么大的差别。” 

使用系数 A 的估计值森可以让我们对样本中的每个个 
体计算估计值乏=21,糸 X *。使用 f 以及临界参数&， 
d 2 的估计值 I 和可以对样本中每个个体处于不同剥 
夺程度的概率进行估计。这些估计可分别用 P ,,， A 和 P *3 
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表示，计算如下: 


/\ 

Pn - 

= Pr(e, ^ d \ — Zi) = Fid \ — Z d 

[2. 5a] 

/\ 

P a = 

=Pr( d i — Zi<i£i^ d z — Zi') 



=F ( 夂 一 1)—F ( 心 一 Z,.) 

[2. 5b] 

= 

— Pr(e, ^ d 2 _ Z, ) = 1 — F( 8 2 _ 2\ ) 

[2. 5c] 


其中，对每个 i = 1，…， N , 2 ■=, Pa = 1 - 
上面描述的模型同时也称做比例比数模型 （ proportion ¬ 
al-odds model ) ，因为如果我们考虑某个类别 j m 的比数比 

( OR ), GR ( m ) = p ^ y 1 ^ ^，那么这个比数比就独立于类 

别 m , 即不随着 m 的变化而变化。比数比被假定为对所有的 
类别保持不变 [1 «。 


关于符号的说明 


用 STATA 估计的次序回归(不管是 logit 还是 probit ) 并 
不明显包含截 距项: 或者说，方程 2.1 中的戽06= 1，…， K ) 
全部都是斜率。截距项没有明显地表示出来，因为如下所示 
它被并人到临界值衣 和& 中了。另一方面，格林 （2000: 
876) 在用公式表示次序回归时，明显地包括了截距项。对应 
于方程2.1，他的方 程是： 

K 

A = J%+ +eu = Po+Zi +Ei ^ Wi + £ { 

*=i 

[ 2 . 6 ] 

其中卢。是截距项， W ",= 和+乙。格林的临界值用和 
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内 表示(跟 STATA 里面的临界值次和在不一样，究竟如何 
不一样表现如下）。格林 （2000) 设第一个临界值和等于 

O。 [11] 所以在他的表述中，表示概率 P ,,， 乡。和色 3 的方 
程为： 

P a = Pr ( e , <- W ,) = F (- W .) = F (_ 身。 一 Z ,) 

= F ( - Z ,) [2. 7 a ] 

P, 2 = Pr( — W, < e, ^ fl2 — W : ) = F{ fl 2 — W,) 一 F(—W,) 

= F ( fi 2 —爸 0 — Z { ) — F (—哀。— Z 5 

= FdS 2 - Z ^- FiS , - Z ,) [2.7 b ] 

P,3 = Pr ( e , > /? 2 - W ,) = 1- F (^ 2 - W ,) 

=1 — F ( / i 2 ~ /3 o — Zi ) = 1 — F ( 5 2 — Z ,) [2. 7 c ] 

当次 = 片时， STATA 方程 2. 5 a 至 2. 5 c 与格林 （2000) 
的方程 2. 7 a 至 2. 7 c 是相同的。「如也就是说， STATA 的临 
界值等于格林的临界值减去截距项。从这种意义上说， 
STATA 把截距项合并到临界值中去了。 [13] 


次序 l_t 


在逻辑分布的情况下，随机变量 X 的累积分布函 数是： 

Pr(X ^ x) = A(x) = exp(x)/[l 十 expO)] 

=1/(1 + exp(—x)) [2.8] 

如果假设误差项服从逻辑分布， 

Pr(Y, = 1) = A(ft -Z.) = 1/[1 + exp(Z,-ft)] [2. 9a] 
Pr(Y ； =2) = A(&-Z,)-A(ft 一乙） 
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= l/[\-\-expiZi — ^ )] — 1/[1 + expCZi — 在)] 

[2. 9b] 

PrCYi = 3) = 1 - A (在 _ 乙）=1 —1/[1 + exp(Zi -在)] 

[2. 9c] 

则通过使用逻辑分布函数 A(.) 代替 F(.) 最大化似然函数 
(方程 2. 4) ， 获得戽 ，次和备 的估计值。 


次序 probit 


标准正态变量 [14] (SNV)X 的累积分 布是： 

Pr(X<x) = $(x) = P(l/27r)exp(_XV2 ) 從 
J 0 

[ 2 . 10 ] 

如果假设误差项是 SNVs, 

Pr(Y, = 1) = 3)(5, -Z.) [2.11a] 

Pr(Y, = 2) = <^(S 2 -Z,)- 4>(^-Z.) [2. lib] 

Pr(Y ; =3) = 1- $(5 2 -Z,) [2.11c] 

则对 A ， 衣和衣的估计通过使用正态分布函数 《>(.) 代 
替 F(. )最大化似然函数(方程 2. 4) 获得。 


边际效 应:连 续变量 

一个意料之中的问题是当其中一个影响结果的变量的 
值改变的时候，出现不同结果的概率是怎么变化的。例如， 
如果年纪是影响剥夺的一个因素，那么个人处于不同的剥夺 
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程度(没有被剥夺、轻度被剥夺或严重被剥夺）的概率是怎么 
受他/她是大一岁还是小一岁影响的？在逻辑分布下， X * (第 
i 个人 的第々 个决定变量的值)的一个小变化对个人 i 的这三 
种概率的边际效应是： 


9Pr(Y, = 1) 
~~ 3 X ： ~ 


^r[A(^i — Z,)] =—A'(5i — Z ,.) 体 


[2. 12a] 


3 FT ( 3 x 7 ^ = ~ Z,) ~ A(gl ~ Z - )] S 


[A ’ (衣 _ Z t ) — A' ( 次一 Z,)]/?* 

aPr ( Y , = 3) d n »/„ v、i 3 Z ; g、 n 

- dX - = —A(& —Z ;)」 = A (.S 2 — Zi )y3* 

[2.12c] 


[2.12b] 


在正态分布下，则 为： 


dPrCYi = 

:1) 

ax* 


aPr(Y,= 

= 2) 

3X, 


dPriYi = 

= 3) 


ax t 


= ^"[0( 在一乙)] =_ 0’(次 — zo 氏 

[2. 13a] 

=^-[4>(5 2 — Zj) — 4>(^] — Z,)] 

= [3>'( 灰 -Z,)- $’(次一 Z,)]/3* [2. 13b] 

= ^-[1 — $(5 2 — Z ; )] = ^(8 Z — Zi)Pk 


[2. 13c] 


其中 A'(_r) = c/A(:c)/<ir 和 fO) = d <^{ x)/dx 分别是逻辑 
分布和正态分布的概率密度函数。边际效应可以通过估计 
在相关点上的合适的密度函数并乘以相关的系数获得。举 
例，由方程 2. 8,逻辑分布的密度函 数是： 
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/( . _ <i f exp(x) 一 厂 1 + expCr»xpOc)—— 厂 expCr)~f 

X tir .1 + exp(x) _ [1 + exp(_r)] 2 

= A ( x)[l — A (_ r )] 

方程 2. 12 a 的边际效 应是： 

h! iSi — Z, )/i = A(ft 一 Z, )[l — A ( 沒 i _ Zi )]^3* 

i r i i 

1 + exp ( Z ,. — 次 ） _1 1 + exp ( Z ； 

现在如果第 A 个决定变量的值增加一点且 A > 0,那么 
在 logit 和 probit 模型下，没有被剥夺的概率都一定会降低， 
因为通过方程 2. 12 a 和 2. 13 a ， Pr ( Y , = 1) 的推导与体方向 
相反。同时在两个模型中，严重被剥夺时概率都会上升，因 
为通过 2. 12 c 和 2. 13 c , Pr ( Y , = 3) 的推导与译方向相同。 
但是我们并不清楚中间那个概率会发生什么变化。取决于 
其他两个概率怎么变化，轻度被剥夺的概率， PKY ; = 2)，可 
能上升、下降或者保持不变。 [15] 因此，给定某个决定变量的变 
化，不可能根据相关系数的方向对所有概率的变化方向做出 
推断。只有处于两个极端情形的概率的变化方向能被确定。 
由于这个原因，格林 (2000 : 878) 警告说，“我们在解释这个模型 
的系数时必须非常小心，因为这是模型中最不明显的”。 

边际效 应:虚 拟变量 

然而，上述估计边际效应的方法只在决定变量为连续变 
量而非虚拟变量时适用。虚拟变量的作用应该通过比较虚 
拟变量取其中一个值时结果出现的概率和它取另外一个值 
的结果出现的概率进行分析，且这种比较要在其他变量的值 
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保持不变的情况下进行。例如，假设雇佣状态是影响剥夺的 
一 个因素 ，足 ^ = 1表示一个人失业， X * = 0则表示他/她受 
雇。为了分析如果他/她从受雇转为失业如何影响其处于三 
种不同的剥夺程度的概率，首先使用方程 2. 9 a 至 2. 9 c ， 假设 
& = 1对 Z , 进行估计(称为 Z ;) ;如果应用 probit 模型，则使 
用方程 2. 11 a 至 2. 11 c , 计算兄= 1( 没有被剥夺）， Y ; = 2( 轻 
度被剥夺)和 Y , = 3( 严重被剥夺)这三种概率。然后，保持 
其他决定变量的值不变，假设= 0对进行估计(称为 Z 
重新计算以上三种概率。注意，由方程 2. 1，式= Z ?+ 與。 
这两组概率之间的区别就是当个人从受雇状态 0) 转 
为失业状态(足1)，或从失业转为受雇，对他/她处于不同 
剥夺程度的概率的作用。 

平行斜率假设 

次序 logit 和 probit 模型的一个关键假设是方程 2. 1的 
斜率系数译并不随着所关注的剥夺结果的变化而改变。也 
就是说，次序 logit 和 probit 模型符合一种平行斜率累积模 
型，这种模型在 logit 的情况下，采取下列形式： 

log =°i + 

l0g I-A-V2 = ° 2 + t 1 ， 


log A + ^ H - 1- Pm-i 

8 1 — A _ p2 _ … _ pM-\ 


K 

^ a M + 

k=l 


P\+p2^ - Pm = l 
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其中，九= Pr ( y , =;) 0 通过对数据进行多类别 logit 模 
型估计，我们可以对平行斜率假设的有效性进行检验 ( 见第3 
章)。多类别 logit 模型允许斜率系数 A 在不同的结果 j = 
1，…， M 之间不同。当次序 logit 模型估计 K 个系数时，多 
类型 logit 模型估计 K ( M - l ) 个系数如果 L , 是从次序 
logit 模型得出的概率值 ，“ 是从多类别 logit 模型得出的概 
率值，那么我们就能计算2 ( L 2 - L ) ，并与 X 2 ( K ( M - 1)) 进 
行比较。注意，这并不是严格的似然比检验，因为次序 logit 
模型并不嵌套在多类别 logit 模型之中。因此，这个检验只是 
提示性 的:一 个“非常大的值是引起担心的依据，若; f 2 值 
不是很大则不用担心 ( STATA ， 1990:480)。但是，如果我们 
确实有理由相信平行斜率假设并不有效，那么此模型就该用 
多类别 logit 的方法进行估计，就算事实上因变量是明显有 
序的。 
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第 3 节 I 应 用：剥 夺状态 


界定与构造剥夺指数 

有 N 个人，标号为 i = 1，…， N 。 如果某种条件的出现 
导致一个人经历剥夺，那么，这种条件就定义为“剥夺导致条 
件” ( DIC )。 假设有 K 种 DIC , 标号为々=1，…， K , h 是关 
于 DIC 々及个人；的一个类别变量 ， h = 1表示 DIC 对第 i 
个人出现了 ， h = 0 表示没有出现。那么对个人的剥夺程 
度，记为 A % 定 义为： 


D * = J ] a；h [2.14] 

A =1 

其中 W >0是赋予第々个 DIC 的权重，且独立于所考虑的个 
人。如果与个人 DIC 相关的权重定义为 W =1 —九，其中 
p k 代表条件々发生的频数，那么 W 包含了“相对剥夺”的概 
念，即一个特定的 DIC 被经历的频数越小，那么当它被经历 
的时候赋予它的权重就越大。这些权重的使用响应了德赛 
和沙 （Desai &• Shah , 1988) 的工作，他们在重新检验汤森 
( Townsend , 1979) 的原始数据时，从根本上主张被剥夺了几 
乎所有人拥有的东西要比被剥夺了很少人拥有的东西影响 
更大。 
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只在偶然的情况下，权重 W 总和为1 (sum to unity ) 0 
但是，它们却可通过定义沿 = w / n 标准化，其中 n = 

。在这种标准化之下，个人 i 的剥夺程度可以定 

*=i 

义为： 

Di = D ' f 2 _1 = ( 2 I * )0 1 = [2.15] 

*=i *=i 

因为 D , 只是的一种简单的标量转换，所以可以通过 
使用 A ， 与使用 or —样，获得个人在他们的剥夺程度上 
的相同排序。但是，在标准化权重方面，剥夺指数 A 比 
D * 提供了更好的解释，所以随后的分析将会采用 A 这种 

标准。因为，在定义上 交巩=1， 所以方程 2. 15暗示着 

i = l 

0<£», <1:当0, =0时，表示没有任何一种 DIC 出现，也 
就是当对所有的々=1，…， K ， 时； 当 D , = l 时，表 
示所有的 DIC 都出现，也就是当对所有的 k = 1, K , 
=1 时。 

构造剥夺指数的一个主要问题在于决定应该加人哪些 
DIC 。 回顾关于构造剥夺指数的文献，诺兰和惠兰 （Nolan 
Whelan , 1996) 指出，鉴赏力的作用是一个主要的问题。如 
果在生活模式中观察到的差异可以大部分归因于偏好而非 
资源，那么在构造剥夺指数时，若某些条目不被包含在内，也 
不能说明是因为需求的原因。例如，皮亚乔德 （ Piachaud ， 
1987) 强调了处于相似收人水平的家庭在剥夺分数间存在的 
巨大差异。即使我们可以把偏好从需求中分离岀来，研究者 
在选择把哪些条目放人到剥夺指数中时所起的作用又是另 
一个更深层次的 问题。 这样，问题就在于剥夺的测量是应该 
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单单基于个人自己的环境,还是应根据他/她的更宽疼的社 
会以及地理环境。例如，布鲁雅和卡克 (Borooah &• Carcach , 
1997) 注意到居住社区质量在决定人们对犯罪的害怕程度上 
的重要性。最后，如果我们可以取得一系列令人满意的指 
标，还有一个问题在于如何在构造综合指数时对这些指标进 
行加权'。数据本身的限制在这些问题上起中心 作用; 我们只 
能从现成可用的数据中构建剥夺指数，而不能从我们希望可 
得到的数据中构建该指数。作者所构建的剥夺指数基于 
1991年人口普査 ® 的数据，该数据包含了在此地居住的 
13164个人的生活环境的信息。 [17] 比如，这些数据告诉我们 
在普查时个人 是否： 

住在一个通常没有任何成员有机会使用一辆小车 
或小巴的家 庭中； 

住在一个没有任何成员是挣钱者的家 庭中； 

住在一个家庭成员没有专用的室内厕所的家 庭中； 
住在一个没有中央暖气系统的房 子里； 

住在一个没有室内公共供水的房 子里； 

住在一个没有与公共排水管道连通的房 子里； 

住在一个代表非永久住处的房子里； 

住在一个居住人数与房间数量的比例大于1的房 
子里； 

长年患有疾病，面临健康问题或者残疾，这些问题 
限制了他/她的日常活动或者可能做的工作。 


①北爱尔兰1991年的人口普査。一译者注 
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利用这些信息，对退休者和非退休者分别构建了剥夺 
指数。这两组指数都围绕着相同的一组 DIC 构建，但是对 
这些 DIC 赋予的权重随着个人是否退休而不同。正如上面 
提到的，与某个 DIC 相关的权重反映了相关 DIC 被经历的 
频数——频数越低，权重越大。但是，其中一些 DIC 被经历 
的频数在已退休样本和非退休样本之间存在很大差异，在 
对退休者和非退休者构造剥夺指数时使用不同的权重反映 
了这种差异。取决于对他/她计算出来的剥夺指数的值，每 
个人都被指定了三个剥夺程度一没有被剥夺、轻度被剥 
夺、严重被剥夺——中的一种， [18] 与每个结果 （） =1，2, 
3) 和每个人 ( i = l ， …， JV ) 相关的是有序因变量 Y , 的如下 
取值： 


Y , = 1如果这个人没有被剥夺 
y , = 2如果这个人轻度被剥夺 
Y , = 3如果这个人严重被剥夺 

应该特别强调的是，正是这些关于 K 的值的数据典 
型地可供研究者分析利用。在13164个人的全部样本中， 
45. 9% (6042 个人）被归为没有被剥夺， 34. 9% (4594 个 
人）被归为轻度被剥夺， 19. 2% (2528) 被归为严重被 
剥夺。 

方程设定 

用于“解释”个人的剥夺程度的决定变 量为： 

AGE , , 以年为单位，通过设定16岁的人 AGE , = 0进行 
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标准化; [19] 

HIGHED , = 1，如果这个人具有英国标准的学士或者 
更高的学位 资格; 否则 HIGHER = 0； 

MIDED , = 1，如果这个人有高于 A 程度文凭 （ post-A 
level )®， 但低于学位 文凭; 「 2 «否则 MIDED , = 0； 

RET , = 1，如果这个人退休了，否则 RET , = 0； 

INAQ = 1，如果这个人在经济上不活跃 ®， 否则 
/ NAC , = 0 ; 

UE , = 1，如果这个人失业，否则 UE , = 0; 

HNUM , = 1，如果这个家庭的人数大于或等于6,否则 
HNUM ; = 0; 

SNPAR , = 1，如果这个人是单身父亲/母亲，否则 
SNPARi = 0 ； 

AREA , = 1，如果这个人居住在北爱尔兰的 a 地区，否 
则 AREA , = 0;在北爱尔兰1991年的普査中一共有19个这 
样的地区。 [21] 

除了这些变量外，剥夺程度还可能取决于个人的环境， 
因为在北爱尔兰，天主教徒是一个相对来说处于劣势的群 
体，所以也还可能取决于他/她的宗教信仰（在样本的13164 
个人中，7243个是男性，5921个是女性，4364个是天主教徒， 
8889个是新教徒 f %)。 为了说明这点，还应考虑另外两个 
变量： 


① 英国文凭高级水平 ( A - level ) 是中学和大学的衔接课程,其考试成绩是从中学 
升人大学的考核标准;在这个文凭和学位文凭之间，还有大学预科文凭 （Imemational 
Foundation Diploma , IFD ) ——部分大学设有该课程，以及高级国家文凭 （Higher Na - 
tional Diploma , HND ) ——相当于中国的大专文凭。-—译者注 

② 即不从事经济活动。——译者注 
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SEX , = 1,如果这个人是女性，否则 SEX , = 0； 

CT , = 1，如果这个人是天主教徒，否则 CT , = 0。 

因此，在这个应用情况下，方程 2. 1设 定为： 

■D,‘ = A +择 * SEXj + ^ * CT ； +/3i * AGEi +/5s * AGE 2 { 

+ 戌 * HIGHED , + 译 * MDEDi + 译 * RET , 

+ /J * INAC , + j 5 ,o * UE ,-+/3„ * HNUM , 

+ j3i2 * SNPARi +/8i3 * AREAa 

~\~ pz \ * AREAi 0i + e ,- = Zi + e f [2.16] 

年龄变量的平方(上面的 AGg ) 引人了年龄的非线性作 
用: 年龄的增加对 A 的边际作用取决于这个增加是在哪个 
年龄发生的。如果與 <0且译 >0,那么一个人年龄的增加 
降低了他/她的剥夺分数，但是这个人年纪越大这种影响就 
越小。[如 

方程统计原理 

估计参数 A 、匕和匕使观察到样本的可能性最大 
化，其中样本凡= 6042, N 2 = 4594, N 3 = 2528 (见方程 
2.4)。 

这些估计值列于对应次序 logit 模型的表 2. 1以及对 
应次序 probit 模型的表 2. 2中。表 2. 1和表 2. 2中的 
z - mtio 是估计系数与他们的估计标准误差之间的比 ：这些 
Z - ratio ( 渐近）服从零假设为相关系数等于零的 N (0, 1) 

分布。 [24] 
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表 2. 1 北爱尔兰社会剥夺程度的次序 logit 模型结果 


Ordered Logit Estimates ； Log Likelihood = —12423. 562; Ntmiberofobs = 13164 ； 
Li? (20) = 2571.98 ； Prob>f = 0.0000} PseudoR 2 = 0.0938 


y 

Coefficient 

Standard Error 

z 

P> Ul 

[95% Conf. Interval] 

sex 

—0. 1649064 

0.0360722 

—4. 572 

0.000 

—0. 2356066 

-0. 0942061 

ct 

0.1829855 

0. 0393496 

4.650 

0. 000 

0.1058617 

0. 2601092 

age 

-0. 0253924 

0. 0049969 

-5.082 

0. 000 

—0. 0351862 

-0.0155987 

age2 

0. 0008173 

0. 0000946 

8. 638 

0. 000 

0.0006319 

0. 0010028 

ret 

0. 6264438 

0. 0875236 

7.157 

0. 000 

0. 4549007 

0. 797987 

inac 

1.297307 

0.0765827 

16.940 

0.000 

1.147207 

1. 447406 

ue 

1. 460677 

0.0619881 

23. 564 

0.000 

1.339182 

1.582171 

highed 

一 0. 9081216 

0.0683311 - 

-13.290 

0. 000 

-1.042048 

-0. 774195 

mided 

-0. 6692574 

0.1230722 

—5. 438 

0. 000 

-0.9104745 

-0. 4280403 

hnum 

0. 9214472 

0.0551311 

16.714 

0. 000 

0. 8133923 

1.029502 

snpar 

0. 305537 

0. 0637575 

4.792 

0. 000 

0.1805746 

0. 4304994 

ard 

一 0. 4497501 

0. 0642359 

-7.002 

0. 000 

-0. 5756502 

-0. 3238499 

dwn 

0. 0492598 

0. 0680278 

0. 724 

0.469 

-0. 0840723 

0.1825919 

crk 

-0.3161319 

0. 0706348 

-4. 476 

0. 000 

-0. 4545735 

-0.1776903 

ant 

0. 3472878 

0. 0717874 

4. 838 

0. 000 

0. 206587 

0. 4879887 

col 

0.4384781 

0.0715933 

6.125 

0.000 

0.2981578 

0. 5787985 

arm 

0. 3824736 

0.0740609 

5.164 

0. 000 

0.237317 

0. 5276303 

ban 

0. 2364069 

0.066677 

3. 546 

0.000 

0.1057223 

0. 3670914 

dry 

0. 0791624 

0. 0787678 

1.005 

0.315 

-0.0752198 

0. 2335445 

frm 

0. 6350174 

0. 0747171 

8.499 

0.000 

0. 4885745 

0. 7814602 

_cutl 

0.1804476 

0. 074681 


(Ancillary parameters) 

_cut2 

2. 058464 

0. 0772157 





y 

Probability 

Observed 



1 

Pr( 

z6+M<_CUtl) 

0. 4591 




2 Pr(_cutl < + w < _cut2) 0. 3493 

3 Pr(_cut2 < + u) 0.1917 
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表 2. 2 北爱尔兰社会剥夺程度的次序 Probit 模型结果 


Ordered Probit Estimates ; Log Likelihood = —12426. 255; Number of obs = 13164 ； 
LRX Z (20) = 2566. 60; Prob 〉 f = 0.0000 ； Pseudo R 2 = 0. 0936 


y 

Coefficient 

Standard Error 

z 

P> kl 

[95% Con/. Interval] 

sex 

一 0.1003127 

0. 021542 

-4. 657 

0. 000 

-0.1425343 

-0. 0580911 

ct 

0.112619 

0. 0235271 

4. 787 

0.000 

0. 0665067 

0.1587314 

age 

-0.0154206 

0.002965 

—5.201 

0.000 

-0. 021232 

—0. 0096093 

age2 

0.0004965 

0.000056 

8.872 

0. 000 

0. 0003868 

0. 0006062 

ret 

0.3679154 

0.0528714 

6.959 

0. 000 

0. 2642894 

0.4715415 

inac 

0. 7680422 

0. 0445939 

17. 223 

0. 000 

0. 6806398 

0. 8554446 

ue 

0. 8555121 

0. 0357888 

23. 904 

0. 000 

0. 7853673 

0. 925657 

highed 

—0. 5562051 

0.0401161 - 

-13.865 

0.000 

-0. 6348313 

-0. 4775789 

mided 

-0.4048568 

0. 0721096 

-5.614 

0.000 

-0. 546189 

-0. 2635246 

hnum 

0.5459127 

0. 0328011 

16. 643 

0.000 

0. 4816237 

0.6102017 

snpar 

0.1748777 

0. 0379915 

4.603 

0. 000 

0.1004157 

0. 2493396 

ard 

-0. 2729771 

0. 03806 

7.172 

0. 000 

-0. 3475734 

-0.1983808 

dwn 

0.0216987 

0.0403927 

0.537 

0.591 

-0. 0574696 

0.100867 

crk 

-0.1831732 

0.0417875 

4. 383 

0.000 

—0. 2650752 

-0.1012712 

ant 

0. 2026288 

0.0428712 

4.726 

0.000 

0.1186028 

0. 2866547 

col 

0. 2518903 

0. 0428189 

5.883 

0. 000 

0.1679668 

0. 3358137 

arm 

0.2122576 

0. 0444114 

4. 779 

0. 000 

0.1252129 

0. 2993024 

ban 

0.129325 

0. 0399411 

3.238 

0.001 

0.0510418 

0. 2076082 

dry 

0. 0360175 

0. 0471155 

0.764 

0. 445 

-0. 0563271 

0.1283622 

frm 

0. 3626456 

0. 0447755 

8.099 

0.000 

0. 2748871 

0.450404 

_cutl 

0.1009536 

0. 0444785 


(Ancillary parameters) 

_cut2 

1.212453 

0. 0453671 





•V 

Probability 

Observed 



1 

Pr( 

z6 + a<_cutl) 

0.4591 



2 

Pr(_cutl + _cut2) 

0. 3493 



3 

Pr(_cut2 < + «) 

0,1917 




格林 (2000:831 — 833) 提供了一些测量离散因变量方程的 
“拟合优度”的建议。他提议，至少我们应该报告对数似然函数 
最大化了的值。 L , 的值就是最大对数似然值，列于表格的顶部 
(分别为 一12423. 56和 一12426. 25)。由于方程中所有斜率都为 
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零的假设经常令人很感兴趣，所以还应该报告“完整”模型和“只 
有截距项”模型的比较结果。表 2. 1和表 2. 2顶部的/值(分 
别为 2571. 98和 2566. 6) 等于 2( L , — LJ ，其中 L „ 是当解释变 
量只有常数项时的对数似然函数的值， h 则如前面观察到的， 
是当所有的解释变量都包括在内时对数似然函数的值。自由 
度等于被估计的斜率系数的个数。这些/的值完全拒绝了这 
个模型不比“只有截距项”的模型更具解释力的零假设。 [25] 

" pseudo - J ? 2 ”被定义为 1— L / Lo , 这归功于麦克法登 
( McFadden , 1973)。这个值的范围固定在0与1之间。值 
为0对应于所有的斜率系数均为0,值为1对应于理想预测 
(也就是 ， h =0)。遗憾的是，正如格林 (2000) 指出的，介于 
0和1之间的值并没有自然的解释，虽然提示是 pseudo - J ? 2 
的值随着模型拟合的改善而增加。还有人提出其他方法。 
本阿齐瓦和勒曼 ( Ben-Akiva Lerman , 1985) 以及凯和利特 
尔 (Kay &■ Little , 1986) 提出了一种通过预测规则测量正确 
预测的平均概率的拟合方法。卡默 ( Carmer ，1999) 提出了一 
种纠正本阿齐瓦/勒曼测量不足之处的方法，考虑了在不平 
衡样本中，对频数少的结果进行的预测往往非常糟糕这样一 
个事实。维尔和齐默尔曼 （Veall &• Zimmerman , 1996) 在他 
们的 pseudo -1? 2 测量中，认为在多类别 probit 或者 logit 类型 
的模型中，只有麦克法登 (1973) 的方法“看起来有价值”。 

另外一种拟合优度的“点”测量方法可能是评估模型的预 
测能力。这些评估在二分选择模型中是例行程序，把按某种 
规则(如当 P , > 0. 5时 Y , = 1,否则 Y , = 0) 预测到的命中 
( Y , = 1) 和不命中 （ Y , = 0) 与真实的命中与不命中进行比 
较。这个方法可以扩展到多元结果模型，其预测可以基于 
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如果 Ph = M aX) ( ) ，则 I = m 的规则。然后这些预测可 

以与估计所有情况都处于因变量最常见类别中的这样一种‘‘简 
单”模型进行比较，从这个简单模型到完整模型减少了的误差的 
百分比就可以计算出来了。但是，这种方法并不是没有缺陷。 
首先，与线性回归模型中系数被选择以最大化记的情况不同， 
在离散选择模型中,系数的估计值并不最大化任何拟合优度测 
量。所以，不管拟合优度怎么被测量，以拟合优度为基础对模型 
进行评估都可能是误导性的。第二，这些预测严重取决于采取 
的预测规则，但可能这些预测规则本来非常不适合样本的需要。 
比如，在一个二分模型中，如果样本是不平衡的——就是说有 
更多的1，更少的0—则模型应该预测估计概率最大的结果这 
样的一个规则就可能永远无法预测到一个1(或者0)。 


估计值 


表 2. 1和表 2. 2中的所有系数，除了两个与居住在 
County Down 和 County Derry 地区（表中的 和 变 
量 ) 相关的系数之外，其他都明显不等于 0 。 在表 2. 1 的 “P> 
ur 这列下面的数字表示，在和的系数等于0的零 
假设下，分别有 46. 6%和 31. 5%的机会，会观察到超出观测 
值 0. 0492598和 0. 0791624的值。在表 2. 2的 “P > | z |” 这 
列下面的数字表示，在这两个系数等于0的零假设下，观察 
到一个超出观测值的数值的机会为“零”。在“95% Conf . In - 
terval ” 这列下面的数字表示如果它们的相关系数要在5 %显 
著性水平下不等于零，估计值必须超出的上下限。在表 2.1 
和表 2. 1中，对 dtm 和 dr •: y 系数的估计值处于它们的95%区 
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间内，而其他系数的估计值却在它们的区间之外。 

在解释单个系数的时候，必须强调其他条件不变(“其他 
事情相同”)的重要性。变量的估计值是正的，表示在其他 
条件不变的情况下，天主教徒与新教徒相比，有更高的被严重 
剥夺的概率和更低的没有被剥夺的概率。这并不是说每个天 
主教徒都比每个新教徒有更高的被严重剥夺的概率。相反， 
正确的说法应该是，给定两个除了在宗教信仰之外其他每种 
特征都相似的人，天主教徒比新教徒更加可能被严重剥夺，更 
加不可能没有被剥夺。变量的估计值是负的，表示其他条 
件相同的女性比男性有更低的被严重剥夺的概率和更高的没 
有被剥夺的概率。其他系数的解释相似。比如，变量 
和 mided 的负的估计值表示,在其他条件相同的情况下，具有 
高学历文凭的人比没有高学历文凭的人有更低的被严重剥夺 
的概率和更高的没有被剥夺的概率。正如前面的讨论所说明 
的，系数估计值的方向只允许对处于两端的结果，其概率随着相 
关变量值的改变而变化的方向进行估计。处于中间的结果其概 
率的变化方向不能推断。比如，从对估计值的审查中，我们无法 
判断女性相对于男性来说被轻度剥夺的概率更大还是更小。 


临界点 


估计出来的临界值呈现于表中各估计值的下面。表 2. 1 
和表 2. 2的下方显示的部分表示各类别的概率如何从拟合 
方程中计算出来。这部分显示的结果通过在 oprobit 和 
ologit 命令语法中加人 “ table ” 这个选择命令而得，这些命令 
列于第4章的程序表中。有序回归背后的假设是观察到的 
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类别代表了粗略的但以一种隐含的等级正确排序的差别。 
属于这些类别的概率基于潜在变量的值跨越特定界限的概 
率，这些界限是通过临界点的值而建立的。 

在次序 logit 模型中，这两个临界点被估计为 [27] _cwd = 
0. 1804476和_加2 = 2. 058464,在方程 2. 5 a 至方程 2. 5 c 的符 
号中， Si =_ cutl , 因此，在次序 logit 模型中，一 

个人没有被剥夺的概率是 Pr ( Z , + e , <0.1804476) ，被轻度 
剥夺的概率为 Pr (0. 1804476 < Z ,+ e ,<2. 058464)，被严重 
剥夺的概率为 Pr ( Z , + e ; ^ 2. 058464)。在次序 probit 模型 
中，这两个临界点被估计为= 0. 1009536和 _ cut 2 = 
1. 212453。在这个模型中，一个人没有被剥夺的概率是 Pr ( Z , 
+ e ,<0.1009536), 被轻度剥夺的概率为 0. 1009536 < Z , + e , < 
1. 212453), 被严重剥夺的概率为 Pr ( f , + e ; > 1. 212 453) 。 这 
两个模型中的临界点不一样的原因是斜率系数的估计值也完 
全不同。但是，每个模型中估计出来的斜率和临界系数的结 
合使这两个模型得出的预测非常相似。 

概率估计值 :个人 的估计 


用估计到的——记住，可利用表 

2.1 中的估计值，结合每个人的决定变量的取值而得出—— 
STATA 会对样本13164个人中的每个人，通过分别计算方 
程 2. 5 a , 2. 5 b 和 2. 5 c 中的 p a , 彡 2 和彡…对他们处于三 
种不同的剥夺程度的概率进行预测。表 2. 3显示了通过误差 
项的逻辑分布对样本前25个人的估计结果。从表 2. 3我 
们可以看到，给定他/她的情况，第17个人有非常低的被严重 
剥夺的概率(4%)和非常高的没有被剥夺的概率(78%)。另 
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一方面，第二个人的情况表示他/她有非常高的被严重剥夺的 
概率(69%)和非常低的没有被剥夺的概率(6%)。把 logit 模 
型预测的概率与假设&为正态分布而得出的概率进行比较是 
非常有启发性的。表 2. 4列出了后者的估计结果。对表 2. 3 
和表 2.4 进行的比较显示，尽管系数估计值在 logit 和 probit 
模型之间存在差异，预测到的概率却非常相似。 


表 2. 3处于不同剝夺水平的次序 Logit 概率计 算值: 样本前25个观瀏值 


P num 

Pi 

/>2 

户 3 

1 

0. 2468799 

0. 4350583 

0. 3180617 

2 

0. 0635542 

0. 2438714 

0. 6925744 

3 

0. 1456977 

0. 3815914 

0. 472711 

4 

0. 221723 

0. 4290327 

0. 3492444 

5 

0. 1984064 

0. 4197503 

0. 3818433 

6 

0. 0774309 

0. 2769676 

0. 6456016 

7 

0. 3072922 

0. 4363922 

0. 2563156 

8 

0. 6020886 

0. 3061397 

0. 0917717 

9 

0. 6067917 

0. 303063 

0. 0901453 

10 

0. 5668221 

0. 3285579 

0. 10462 

11 

0. 3003936 

0. 4370245 

0. 2625819 

12 

0. 4497833 

0. 3926532 

0. 1575635 

13 

0. 1598765 

0. 3946234 

0. 4455001 

14 

0. 5337384 

0. 348435 

0. 1178265 

15 

0. 6265731 

0. 2899149 

0. 0835119 

16 

0. 5928456 

0. 3121286 

0. 0950258 

17 

0. 7833934 

0. 1760466 

0. 04056 

18 

0. 5323462 

0. 3492447 

0. 1184092 

19 

0. 5169058 

0. 3580674 

0. 1250268 

20 

0. 6024157 

0. 3059263 

0. 091658 

21 

0. 5469929 

0. 3406158 

0. 1123913 

22 

0. 5918246 

0. 3127853 

0. 0953901 

23 

0. 7823876 

0. 1768215 

0. 0407909 

24 

0. 5389312 

0. 3453955 

0. 1156733 

25 

0. 4514354 

0. 3918849 

0. 1566797 


注 : 个人序号。 
pl= “ 没有被剥夺 ” 的概率。 
p2= “ 轻度被剥夺 ” 的概率。 
/>3 = “ 严重被剥夺 ” 的概率。 
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表 2.4 处于不同刹夺水平的次序 Probit 概幸计 算值: 样本前25个观测值 


P num 

Pi 

P2 

户 3 

1 

0. 2564767 

0. 4197788 

0. 3237445 

2 

0. 0561468 

0. 2607234 

0. 6831297 

3 

0. 148693 

0. 3789889 

0. 4723181 

4 

0. 2297609 

0. 4152423 

0. 3549968 

5 

0. 2077654 

0. 4091158 

0. 3831188 

6 

0. 0723101 

0. 2918726 

0. 6358173 

7 

0. 3164209 

0. 4204631 

0. 263116 

8 

0. 5960203 

0. 3162006 

0. 0877791 

9 

0. 6006402 

0. 3134694 

0. 0858905 

10 

0. 5609338 

0. 3361012 

0. 102965 

11 

0. 3078035 

0. 4210712 

0. 2711253 

12 

0. 4515077 

0. 3873188 

0. 1611736 

13 

0. 1692549 

0. 3920921 

0. 438653 

14 

0. 5286788 

0. 3530054 

0. 1183157 

15 

0. 6201291 

0. 3016761 

0. 0781948 

16 

0. 5868787 

0. 3215305 

0. 0915909 

17 

0. 7813467 

0. 189157 

0. 0294963 

18 

0. 5321902 

0. 3512332 

0. 1165766 

19 

0.5122991 

0. 3610432 

0. 1266577 

20 

0. 5962939 

0. 3160395 

0. 0876666 

21 

0. 5415704 

0. 3464162 

0. 1120134 

22 

0. 5858997 

0. 3220953 

0. 092005 

23 

0. 7803024 

0. 1899634 

0. 0297342 

24 

0. 5342544 

0. 3501835 

0. 1155621 

25 

0. 449369 

0. 3881331 

0. 1624979 


注 :P_= 个人序号。 

户 1 = “ 没有被剥夺 ” 的概率。 

户 2=“ 轻度被剥夺 ” 的概率。 

户 3=“ 严重被剥夺 ” 的概率。 

对列出的25个人中的每个人来说，用 logit 和 probit 方法估 
计出的处于三种剥夺程度的概率并没有很大不同。从某种 
意义上说，用哪个模型并不重要，预测结果非常相似。 

个人概率可用于生成剥夺程度的样本统计值。这些统 
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计值列于表 2. 5 ( logit 模型）和表 2. 6( probit 模型）中。 

这两个表中显示的多 a ， A 和多。的均值(分别用 A ， 
多 2 和 A 表示)在 logit 和 probit 模型间稍有不同。但是，取 
整数之后，这些不同消失了且估计值分别为： 46%，35%和 
19%。在 logit 模型中，用上述方法算出的平均概率，等于在 
三个剥夺类别中的样本比例。 [28] 这是次序 logit 模型的一个 
特性。在 probit 模型下平均概率很接近，但不等于样本比 
例，这种情况也是在实践中经常见到的。 

表 2. 5 和表 2. 6中的平均概率总和精确地为 1。 这是因 
为个人的概率估计(平均概率从这些概率估计中计算而得） 
总和为1。 

Pa , A 和彡 a 的中位数(第 50 个百分位数），如表 2. 5 
和表 2. 6所示，在 logit 和 probit 模型间存在些微的差异，但是 
这些差异再次在取整数之后消失了，产生的中位数概率的估 
计值分别为48%，37%和14%。对这两个模型中的任何一个 
来说，中位数概率都不一定总和为1，在这个应用实例中，它们 
的总和确实并不等于1。原因在于虽然对任何一个人估计值 
的总和为1，但是多多 2 和多 a 的中位数却不一定与同一 
个人相关。比如，如果彡 ;1 ，彡 2 和 p ^ G ^ l , 13164) 的 
值按照递增或递减的顺序排列，那么在&1排列中处于第 50 
个百分位数的那个人可能与在多 a 中第 50 个百分位数的那个 
人不同。在 logit 的估计值方面(表 2. 5)， 没有被剥夺的概率 
(彡 a ) 处于最低的百分位数的是 6. 7%，在这个等级里面最低 
的估计值为1.9%。在这个量表的另一端，多 a 在最高的百分 
位数的值为 83. 1%，在这个级别里面最高的估计值为87%。 
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表 2.5 不同剥夺程度的样本统计值 :loglt 模型 




Pr(y 

=1) 



Percentiles 

Smallest 



1% 

0. 0675202 

0. 0185615 



5% 

0. 1466481 

0.0198162 



10% 

0. 1875675 

0. 0300967 

Obs 

13164 

25% 

0. 303902 

0. 0347162 

Sum of Wgt. 

13164 

50% 

0. 4843619 


Mean 

0. 4592781 



Largest 

Standard Deviation 

0. 1889648 

75% 

0. 5993176 

0. 8697239 



90% 

0. 6954355 

0. 8697425 

Variance 

0. 0357077 

95% 

0. 7368268 

0. 8699151 

Skewness 

—0. 1866478 

99% 

0. 8308569 

0. 8699151 

Kurtosis 

2. 155329 



Pr(y 

= 2) 



Percentiles 

Smallest 



1% 

0. 1389147 

0. 0915195 



5% 

0. 2075179 

0. 0969696 



10% 

0. 239251 

0. 1077327 

Obs 

13164 

25% 

0. 2989144 

0. 1077327 

Sum of Wgt. 

13164 

50% 

0. 3674155 


Mean 

0.3493639 



Largest 

Standard Deviation 

0. 076207 

75% 

0.4150781 

0. 4377985 



90% 

0. 4339717 

0. 4377985 

Variance 

0.0058075 

95% 

0. 4366746 

0. 4377985 

Skewness 

-0. 8337451 

99% 

0. 4377566 

0. 4377985 

Kurtosis 

2.917122 



Pr(y 

= 3) 



Percentiles 

Smallest 



1% 

0. 0301859 

0.0223522 



5% 

0. 0517813 

0.0223522 



10% 

0. 0627571 

0.0223856 

Obs 

13164 

25% 

0. 0927392 

0. 0223891 

Sum of Wgt. 

13164 
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续表 


50% 

0. 1399815 


Mean 

0. 191358 



Largest 

Standard Deviation 

0. 1405856 

75% 

0. 2593728 

0. 8095671 



90% 

0. 3984033 

0. 8312855 

Variance 

0.0197643 

95% 

0.4708132 

0. 8832142 

Skewness 

1.451671 

99% 

0. 6786129 

0. 889919 

Kurtosis 

4.969932 


表 2. 6 

不同剥夺程度的样本统 计值 : probit 模型 




Pr(y 

=1) 



Percentiles 

Smallest 



1% 

0.0610129 

0. 0089802 



5% 

0. 1495682 

0. 0095785 



10% 

0. 1936998 

0.0190097 

Obs 

13164 

25% 

0. 311691 

0. 0255515 

Sum of Wgt. 

13164 

50% 

0. 4870896 


Mean 

0. 4602124 



Largest 

Standard Deviation 

0.1855043 

75% 

0. 5928672 

0. 8747257 



90% 

0. 6891779 

0. 8747432 

Variance 

0.0344118 

95% 

0. 7340055 

0.8749362 

Skewness - 

-0.212917 

99% 

0. 8299778 

0. 8749362 

Kurtosis 

2. 250704 




= 2) 



Percentiles 

Smallest 



1% 

0. 1500103 

0.0957713 



5% 

0. 2209043 

0. 09959 



10% 

0. 2547602 

0.1132009 

Obs 

13164 

25% 

0. 3088254 

0. 1132009 

Sum of Wgt. 

13164 

50% 

0. 3662931 


Mean 

0.3488479 



Largest 

Standard Deviation 

0.0663654 

75% 

0. 4044376 

0. 421618 



90% 

0. 418923 

0_ 421618 

Variance 

0.0044044 

95% 

0. 4207648 

0. 421618 

Skewness - 

-1. 039971 

99% 

0. 421588 

0.421618 

Kurtosis 

3. 528536 
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续表 




Pr(y 

= 3) 



Percentiles 

Smallest 



1% 

0. 0194342 

0.011863 



5% 

0. 0412402 

0.011863 



10% 

0.0542446 

0. 011892 

Obs 

13164 

25% 

0.0890826 

0.0118946 

Sum of Wgt. 

13164 

50% 

0.1402645 


Mean 

0. 1909397 



Largest 

Standard Deviation 

0. 1432815 

75% 

0.2674853 

0. 7992974 



90% 

0.4023936 

0. 8322631 

Variance 

0.0205296 

95% 

0.4708187 

0. 8908314 

Skewness 

1. 315678 

99% 

0. 668156 

0. 8952485 

Kurtosis 

4.483449 


概率估计值 :均值 的估计 

在前文中，平均概率的估计值从个人概率^ ;1 ，多, 2 和 
p a (i = 1, •••, 13164) 的估计值中计算得出。在 logit 模型 
中平均概率正好等于样本比例，在 probit 模型中，他们也很 
接近样本比例。但是，还有另外一种方法计算平均概率(见 
Greene , 2000:879) ，且这种方法产生的结果与上面的不同。 

设元=为第々个决定变量的平均值， 让么的 
均值 等于： 


Z = 2Z,/N= ^X^/N 

t = 1 j = 1 4 = 1 

= P k ^^ Xjk/N = 2 ^ k X k [2. 17] 

k i k 

然后计算 A ， 多 2 ，和 如下： 
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p, = Pr(e,< h~Z) [2.18a] 

p 2 =Pr(d i -Z<e,^ 8 2 -Z) [2.18b] 
pi = Pr(e ； ^ 8 2 — Z) [2. 18c] 

通常 . P \ ^ P\i Pz ^ P 2 i P 3 ■> 这并不奇怪。因 
为尽管 A 和 P , i ) - 1, 2, 3) 两者都旨在测量处于不同剥 
夺水平的总体概率，但是它们的计算方式却非常不同。丸计 
算为估计到的个人概率的均值，而^^是从个人决定变 
量的值结合估计到的临界点计算出来的。另一方面， A 绕 
过了个人概率，反而是用个人 Z , 的均值 f (或者，等于用决定 
变量& 的均值元计算而得），结合估计到的临界点而得出。 
表 2. 7 和表 2. 8 分别比较了 logit 和 probit 模型中爻的值和 
P , 的值。 


表 2. 7处于不同剥夺程度的总体 概率: logit 模型 


概 率 

计算为个人概率的均值 j 

从麟变量的均值體 而得: 

A 

P 

没有被剥夺 

0. 459 

0. 447 


轻度被剥夺 

0. 349 

0. 394 


严重被剥夺 

0. 191 

0. 159 


表 2.8 处于不同剥夺程度的总体 概率: probit 模型 

概 率 

计算为个人概率的均 值:； 

从决定变量的均值计算而得: 

八 

P 

没有被剥夺 

0.460 

0. 452 


轻度被剥夺 

0. 349 

0. 387 


严重被剥夺 

0. 191 

0. 161 



边际概率的计 算:连 续变量 


模型中唯一的连续变量，如方程 2. 16 所示，是 AG£, 和 
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AGE % 为了计算个人年龄每增加1年对他/她处于三种剥 
夺程度概率的影响，我们需要在相关点上估计合适的密度函 
数并乘以与两个变量相关的系数估计值(见方程 2. 12 a 至方 
程 2. 12 c , 以及方程 2. 13 a 至方程 2. 13 c ) 。 

还可以通过下列两个方式中的任何一种完成。 

1. 对样本中的每个人，在相关点上对其计算边际效应。 
对个人= 1，…， 13164) ,这些相关 点为： 8 x — Z i 对应 
于 Pr ( Y ,. = 1) 的边际效应 ； h - 2,和夂 一 f ;对应于 Pr 
( Y , = 2) 的边际 效应； Z , 对应于 Pr ( Y , = 3) 的边际效 
应。用这些估计值乘以 AGE , 的系数估计值 （ ^ ) ，同时也用 
这些估计值乘以 AGE ^ 的系数估计值 （ ^)。这两个结果相 
加就得到了每个人年龄的一个小变化 （1 年）对他/她的概率 
的边际效应。然后所有这些个人作用的均值就产生了样本 
中每个人的年龄增加1年对(处于不同的剥夺程度的）概率 
的平均影响。 

2. 计算样本中所有个人值的均值（见方程 2. 17)。 
如果这个均值记为乏，在相关点计算边际 效应：匕一 乏对应 
于 Pr ( Y , = 1) 的边际 效应；夂 一乏和 8 ,- Z 对应于 
Pr ( Y ,_ = 2) 的边际 效应； 匕一乏对应于 Prd = 3) 的边际 
效应。 

用这些估计值乘以 AGE , 的系数估计值，同时也用这些 
估计值乘以 AGEJ 的系数估计值。这两个结果相加就得到 
了每个人年龄的一个小变化 (1 年)对他/她的概率的边际效 
应。然后所有这些个人作用的均值就产生了样本中所有人 
的平均年龄增加1年对（处于不同的剥夺程度的）概率的 
影响。 
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表 2. 9和表 2. 10展示了用以上两种不同的方法计算出 
来的 logit 和 probit 模型中年龄增加的边际效应。 


表 2. 9 年龄对处于不同剥夺程度的边际效应 : logit 模型 


概 率 

计算为个人边际效应的均值 

从决定变量的均值计算而得 

没有被剥夺 

—0. 00523 

— 0. 00607 

轻度被剥夺 

0. 00191 

0. 00279 

严重被剥夺 

0. 00332 

0. 00329 

表 2 . 10 年龄对处于不同剥夺程度的边际 效应 : probit 模型 

概 率 

计算为个人边际效应的均值 

从决定变量的均值计算而得 

没有被剥夺 

-0. 00524 

—0. 00591 

轻度被剥夺 

0. 00171 

0. 00226 

严重被剥夺 

0. 00353 

0. 00365 


边际概率的计 算:虚 拟变量 

在前面我们观察到一个虚拟变量的作用应该通过比较 
它取其中一个值时的概率与取另一个值的概率进行分析，在 
这个比较过程中其他变量的值保持不变。这个方法现在用 
于分析宗教信仰对处于不同剥夺程度的概率的影响，通过比 
较(对所有的 0 CT , = 1( 宗教虚拟变量)的情况与（对所有的 
0 CT , = 0的情况。与连续变量的情形一样，这种广义的方 
法可以采用以下两种途径中的任意一种。 

1. 假设其他条件均同且样本中的所有人都是天主教徒 
CT , = Hi = 1-13164)。 那么在这种情况下， Z ,( Z , 的估计 
值)从方程 2. 16中用系数估计值以及对所有 iCT , = 1计算 
而得。把这个估计出来的值叫做乏:。 
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让多^表示在这个假设的情况下个人 t ' 处于剥夺程度 j 
0 = 1, 2, 3) 的（计算出来的）概率，其中这些概率从方程 

2. 5 a 至 2. 5 c 中-或者，如果使用 probit 模型，从方程 2. 11 a 

至方程 2. 11 c 中一用 Z , = Z ： 计算而得。现在假设其他 
条件相同且样本中的所有人都是新教徒，对所有 i =丄… 
13164, CT , = 0,让 if 表示 Z , 的估计值。从方程 2. 6可 
知，乏：= Zf + 及 3 。让％表示在这些假设的情况下个人 i 
处于剥夺 程度只 j = 1，2, 3) 的(计算出来的)概率。对任何 
样本中的个人 i ， 和 f = 的差别完全来自于宗教信仰的差 
别：七是用 fl ——也就是，天主教徒这个变量等于1 
时——计算出 来的； ^是用 ff ， 天主教徒这个变量等于0 
时计算出 来的; 在其他变量的值没有任何变化的情况下。如 
果巧= %/ N 分别是两组概率 
估计值的均值，那么它们之间的差异就测量出了宗教信仰对 
处于不同剥夺程度的平均概率的影响。 

2. 另一个方法是比较对样本中的所有人，变量 CT , 取两 
个不同值时的两种概率,且在每种情况下其他变量都取样本 
均值。让乡和々分别表示对所有； =1-13164, CT , = 1 
和 CT , = 0时乏的值，且在每一种情况下其他变量 X ,= 
元。由方程 2.16, 云=>+| 3 。实际上，这个应用除了宗教 
信仰外还包括了样本的平均特征，而且在一种情况下它是天 
主教徒，在另一种情况下它是新教徒。那么，在方程 2. 5 a 至 
方程 2. 5 c 中使用矛，然后矛，就可以对这两种假定的情形 
(前一种情形下这个人为天主教徒，后者这个人为新教徒)计 
算出（处于没有被剥夺、轻度被剥夺、严重被剥夺的）三种概 
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率的估计值。如果这两种概率分别记为七和9；0' = 1，2, 
3) ，那么它们之间的差异就测量出了宗教信仰对处于不同剥 
夺程度的概率的影响。 

表 2 . 11展示了在 logit 模型下 f 和卢卜 以及 W 和 C 
0' = 1, 2, 3) 的值，表2.12则表示？^^模型下的情况。这 
两个表有两个重要的特点。首先，对于两种计算边际效应的 
方法中的任何一种， logit 和 probit 概率之间都几乎没有差 
异。其次，对任何一个模型来说，用两种不同的方法计算出 
来的概率之间存在着非常大的差异。注意，用个人概率的均 
值计算出来的处于严重被剥夺的概率显著地高于用样本的 
平均特征计算岀来的处于严重被剥夺的概率。 


表 2 . 11宗教值仰对处于不同剥夺程度的概率的彩响 :logit 模型 


概 率 

计算为个人边际效应的均值 

CAT PRT 

从决定变量的均值计算而得 

CAT PRT 

没有被剥夺 

0.432 

0.472 

0.417 

0.462 

轻度被剥夺 

0. 360 

0. 346 

0. 407 

0. 387 

严重被剥夺 

0. 207 

0. 182 

0. 176 

0. 151 

表 2 . 12 

宗教信仰对处于不同剥夺程度的概率的 影响 : probit 模型 

概 率 

计算为个人边际效应的均值 

从决定变量的均值计算而得 


/ CAT 

PRT 

CAT 

PRT 

没有被剥夺 

0. 433 

0.473 

0.421 

0. 466 

轻度被剥夺 

0. 359 

0. 346 

0. 398 

0. 382 

严重被剥夺 

0. 208 

0. 191 

0. 181 

0. 152 


处于严重被剥夺的状态是拥有剥夺决定变量的“极端” 
值的结果。极端值的影响在个人其他变量值被设置为样本 
均值时被减弱了。从另一方面来说，在概率计算中使用个人 
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的变量值时，极端值被允许充分地发挥了作用。 

那么哪一种方法更适合使用呢？关键的问题是，当我们 
感兴趣的虚拟变量取各不相同的两种值的时候，其他变量的 
值是如何保持不变的。实际上，第二种方法对每个人都分配 
了样本的平均值。但是，平均值并不是神圣不可侵犯的，这 
个分配的共同值也可以用中位数或者任意其他值，且这些不 
同分配方式中的每一种都会在计算出来的概率 L 上产生一 
个不同的结果。 

第一种方法就没有这个缺陷。因为个人的值没有被干 
扰，计算出来的个人的概率是唯一的，所以在两种不同的情 
形下，平均 [29] 概率无是唯一的。 
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第4节 | 对次样本的 估计: 
特征与系数 


宗教信仰由于方程 2. 16中译的存在而对处于不同剥夺 
程度的概率(表 2. 11和表 2.12) 有影响。这意味着，在第一种 
方法下乒 if ， 在第二种方法下乡关矛。因此,样本中 
的每个人 CT , = 1时被剥夺的概率不同于样本中每个人 
CT ; = 0时的概率。但这导致我们考虑这样一种可能性，即 
对方程 2. 16中的每个变量，“天主教徒”的系数都不同于“新 
教徒”的系数。也就是说，方程 2. 16的估计应该允许天主教 
徒与新教徒的系数互不相同。有两种（几乎等同的）的操作 
方法。第一种只估计一个方程,但允许方程中的每个天主教 
徒的系数都与相应的新教徒的系数不同。第二种对天主教 
徒和新教徒次样本分别估计两个不同的方程。为了执行第 
一种策略，定义方程 如下： 

D , = + 7 i * CT , +译 * SEX , + y 2 * CT , * SEX ； +译 * 

+ y 3 *CT, * 也疋,+戽 ^AGEl+y^CT^AGE) 

+译 * HIGHED , + y 5 * CT ,. * HIGHED , +译 * MDED , 
+ y s * CT t ^ MIDED i +^ ^ RET t + y 7 * CT t * KET , 
+ 属 * JNAC , + y 8 * CI \ * INAC ^^ * UE , 
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H~ /g * C^i * UEi ~\~pio * -|- y 10 * CF, * HMLJMi 

Pn * SVPAJ?! H - yii * CTi * SVPAR, ~\~j3i3 * AREA Z i 

+ •. • + 爲 i * AREAi 0i + y 13 * CTi * AREA 2 i + … 

+ y 2 i * CTi * AREAZi + e , = Z i -\- Z i ~\ - [2.19] 

通过在方程中加入“交互变量”——即用方程 2. 16中的 
原解释变量乘以天主教徒虚拟变量——某个特定变量对剥 
夺的影响就可依据受关注的人是新教徒还是天主教徒而不 
同。在方程 2. 19中，体是“新教徒”的系数_ ，而八 ——交 
互变量的系数一代表了作为天主教徒而导致的对这些系 
数的附加贡献。因此的值测量了“交互作用”的强度。所 
以对 n = o 的检验就是对第々个解释变量与个人的宗教信 
仰之间没有交互影响这个零假设的检验。换一种说法， 
7* =0意味着在第々个解释变量上新教徒与天主教徒的系数 
之间没有差别。与两个不同方程的方法相比，这个单一方程 
“整合”方法的一大优势在于，它可以轻易地检验某个变量对 
这两组人是否有不同的影响。实际上，随后的内容还对这个 
单一方程“整合”方法进行了一定程度的探讨。但是，为了突 
岀说明第二种方法，方程 2. 16对天主教徒和新教徒次样本 
分别进行了估计。表 2. 13和表 2. 14分别展示了当误差被假 
设为逻辑分布时，方程 2. 16对天主教徒和新教徒的估计 
结果。 [31] 

在表 2. 13和表 2. 14所示的方程估计值中，变量止⑽ 
和被丢掉了。这是因为它们的系数单个地（在 Z-score 
上）以及共同地(在似然比检验上）都不显著地不等于0。这 
是一个方法上的重要问题 ：当方 程用于预测时，它们应该包 
含所有的变量，即使其中的一些系数可能并不显著地不等 
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于0,还是应该只包括那些具有显著地不等于0的系数的 
变量。 


表 2. 13北爱尔兰社会剥夺程度的次序 togit 模型 结果: 新教徒样本 


Ordered Logit Estimates Log Likelihood = — 
LRX 2 Q7) = 1527.75; Prob>f = 1 

8124. 0888 ； Number of obs = 8800; 

).0000; Pseudo R 2 = 0.0859 

y 

Coefficient 

Standard Errvr 

z 

p> Ul 

[95 / 4 Conf. interval] 

sex 

—0.2293014 

0.0444134 

-5.163 

0.000 

一 0. 31635 

一 0.1422527 

age 

-0.0275073 

0.0060613 

-4. 538 

0. 000 

-0.0393873 

一 0.0156273 

age2 

0.0008768 

0.0001131 

7.754 

0. 000 

0. 0006551 

0.0010984 

ret 

0.6275465 

0.1008167 

6.225 

0.000 

0. 4299493 

0. 8251437 

inac 

1.179892 

0.0954488 

12.362 

0.000 

0. 9928158 

1. 366968 

ue 

1. 556987 

0.0848854 

18.342 

0. 000 

1. 390615 

1.723359 

highed 

-0. 8085732 

0.085388 

-9.469 

0.000 

-0. 9759306 

-0. 6412159 

mided 

-0. 6320822 

0.1490549 

-4.241 

0.000 

-0.9242244 

-0.33994 

hnum 

0. 95203 

0.08401 

11.332 

0.000 

0.7873735 

1. 116686 

snpar 

0.3647026 

0. 0845436 

4.314 

0. 000 

0.1990001 

0. 5304051 

ard 

-0.4509469 

0.063093 

-7.147 

0.000 

-0. 5746069 

一 0. 327287 

crk 

-0.3349415 

0.0715481 

-4.681 

0.000 

-0. 4751733 

-0. 1947098 

ant 

0. 3530984 

0.0758826 

4. 653 

0.000 

0. 2043712 

0. 5018256 

col 

0. 368263 

0.0833618 

4.418 

0.000 

0. 2048769 

0. 5316491 

arm 

0. 4664409 

0.0988147 

4.720 

0.000 

0.2727676 

0. 6601141 

ban 

0. 2097729 

0.076176 

2.754 

0. 006 

0.0604708 

0. 359075 

frm 

0. 6888737 

0. 0980013 

7. 029 

0.000 

0. 4967947 

0. 8809528 

_cutl 

0.1488535 

0.0834433 


(Ancillary parameto^) 

_cut2 

2.04582 

0.0869085 





y 

Probability 

Observed 



l 

Pr( xft + a < _cutl) 

0. 4970 



2 

Pr(_cutl < i + u < _cut2) 

0. 3399 



3 

Pr(_cut2 〈 jA + u) 

0.1631 
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表 2. 14北爱尔兰社会剥夺程度的次序 logit 模型 结果: 天主教徒样本 


Ordered Logit Estimates Log Likelihood — —4283. 363; Number of obs = 4364 ； 
LRX 2 (17) = 875. 06 ； Prob>f = 0. 0000 ； Pseudo R 2 - 0. 0927 

y 

Coefficient 

Standard Error 

z 

P> Ul 

[95% Conf. Interval] 

sex 

-0.0430983 

0.0621282 

-0. 694 

0. 488 

-0.1648672 

0. 0786707 

age 

-0.0181642 

0.0089546 

-2.028 

0.043 

-0.0357148 

-0. 0006136 

age2 

0.00064 

0.0001754 

3. 648 

0. 000 

0.0002961 

0.0009839 

ret 

0. 6109521 

0.1773859 

3. 444 

0.001 

0. 2632821 

0.958622 

inac 

1. 487517 

0.1299683 

11.445 

0. 000 

1. 232784 

1.742251 

ue 

1. 364899 

0.0906986 

15. 049 

0. 000 

1.187133 

1. 542665 

highed 

-1.09291 

0.1133639 

-9. 641 

0. 000 

-1.315099 

-0. 8707208 

mided 

-0. 7667852 

0. 2172056 

—3.530 

0.000 

—1_ 1925 

-0. 3410701 

hnum 

0. 9087931 

0.0739094 

12. 296 

0. 000 

0. 7639333 

1.053653 

snpar 

0. 239649 

0. 0987062 

2.428 

0.015 

0. 0461884 

0. 4331096 

ard 

-0. 5853662 

0.16575 

-3. 532 

0. 000 

-0.9102303 

-0. 2605022 

crk 

-0. 3226664 

0.1620424 

— 1.991 

0. 046 

-0.6402637 

-0.0050692 

ant 

0. 2364382 

0.1329838 

1.778 

0.075 

-0. 0242052 

0. 4970816 

coi 

0. 4795002 

0.1039698 

4.612 

0. 000 

0. 2757232 

0. 6832773 

arm 

0. 2546794 

0.0926459 

2. 749 

0.006 

0.0730968 

0. 4362621 

ban 

0. 2025872 

0.0954257 

2.123 

0. 034 

0.0155563 

0. 389618 

frm 

0.5243653 

0.0950858 

5.515 

0.000 

0. 3380006 

0. 7107301 

_cutl 

0.0110645 

0.1138485 


(Ancillary parameters) 

_cut2 

1. 866844 

0.1178967 





y 

Probability 

Observed 



1 

Pr( xb-\~u<i _cutl) 

0. 3824 



2 

Pr(_cutl <a6 + «<_cut2) 

0. 3682 



3 

Pr(_cut2 < -f u) 

0. 2493 




一种观点是，如果我们相信某个变量在方程设定中有一 
个合法的位置，那我们就应该坚持这个想法且不管怎样都把 
这个变量包括在内。但另一种观点是，因为估计与预测的目 



logit 与 probit : 次序模型和多类别模型 


的是为了使方程设定面对数据，把预测基于从完整的模型设 
定中得到的系数估计值有可能具有误导性，因为它可能允许 
那些在模型设定中其合法性被数据明显“拒绝”的变量影响 
我们的预测。在前文中，追随第一种观点，预测基于完整的 
模型 设定; 在这一部分中，追随第二种观点，预测基于受限制 
的模型设定。 

表 2. 15说明 ：新教 和天主教样本分别有50%和38%的 
人没有被剥夺，34%和37%的人轻度被剥夺，16%和25%的 
人严重被剥夺。与新教徒相比，天主教徒没有被剥夺的比例 
更小，轻度和严重被剥夺的比例更高（见表 2. 15)，这种实际 
情况可能有两个方面的原因 ：第一 ，那些使被剥夺的概率增 
加的特征不均衡地集中于天主教徒，以及/或者那些使被剥 
夺的概率下降的特征不均衡地集中于新 教徒; [32] 第二，某个 
特定的属性对天主教徒来说，被更加严厉地惩罚（如果是能 
使剥夺增 加的： 比如处于失业状况），以及/或者得到的回报 
更少(如果是能使剥夺降低 的：比 如具有教育资格）。 


表 2. 15北爱尔兰社会剥夺程度:按宗教类别划分 


样本中的百分比 


没有被剥夺 

轻度被剥夺 

严重被剥夺 

总体 

45.9 

34. 9 

19.2 

天主教徒 

38. 2 

36. 8 

24. 9 

新教徒 

49. 7 

34.0 

16. 3 


为了确定天主教一新教之间的剥夺差距(定义为在不同 
的剥夺程度上天主教徒与新教徒的比例差异)在多大程度上 
是由特征差异造成的，在多大程度上是由系数差异造成的， 
在下列问题上提出了计量经济学方面的议题。 





第 2 章次序摸型 


1. 如果新教徒与天主教徒用各自的系数估计值评估他 
们具有的特征，那么对他们处于不同剥夺程度的预测概率会 
是怎样的？把这些概率分别记为多^和= 1， …， 
13164； j - 1, 2, 3), 它们的均值记为 g 和 p]{j = 1, 
2, 3)。[ 33 ] 

2. 如果新教徒的特征用天主教徒的系数估计值进行评 
估，那么它们处于不同的剥夺程度的预测概率会是怎样的 
呢？把这些“合成的”概率记为 q^i = 1，…，13164；;= 
1，2, 3)，它们的均值记为 gO + = 1，2, 3)。 

3. $与€合 g 相比怎样呢？ 

表 2. 16展示了作为一个整体时，以及在各自的次样本 
中，这两组人的 g ， g 与 f 的值这三个概率。表 2. 16说 
明，对样本中所有个人进行计算，新教徒处于没有被剥夺，轻 
度被剥夺和严重被剥夺的平均“自己系数的” [34] 概率分别为 
50%，34%和16%。当新教徒的特征用天主教徒的系数进 
行评估时，没有被剥夺的概率下降到46%，严重被剥夺和轻 
度被剥夺的概率分别上升到19%和35%。这个故事在其他 
被分析的次样本中是类似的（单身父/母亲、退休者、不从事 
经济活动者、失业者以及住在大家庭中的人）。当新教徒的 
特征用天主教徒的系数进行评估时，除了两个例外（退休者 
和失业者），没有被剥夺的概率总是下降，严重被剥夺的概率 
总是上升，虽然很自然地，这些变化的大小随着考虑的次样 
本的不同而变化。 [35] (在没有被剥夺的概率中的）最大的下 
降与(在强烈被剥夺的概率中的）最明显的上升出现在那些 
不从事经济活动的人当中。 
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表 2. 16 天主教徒和新教徒处于不同剥夺程度的概率估计值 * 

概率估计值 

没有被剥夺轻度被剥夺严重被剥夺 


总体 


新教徒(用新教徒的系数估计） 

49.7 

34.0 

16.2 

新教徒(用天主教徒的系数估计） 

45.8 

35.3 

18.9 

天主教徒(用天主教徒的系数估计） 

38.2 

36. 9 

24.9 

单身父/母亲 

新教徒(用新教徒的系数估计） 

37.2 

38.2 

24. 6 

新教徒(用天主教徒的系数估计） 

35.0 

38. 1 

26. 9 

天主教徒(用天主教徒的系数估计） 

27.3 

37.8 

34.8 

退休者 

新教徒(用新教徒的系数估计） 

24.8 

41.4 

33.8 

新教徒(用天主教徒的系数估计） 

24.6 

40.7 

34. 6 

天主教徒(用天主教徒的系数估计） 

20.7 

39.6 

39. 7 

不从事经济活动者 

新教徒(用新教徒的系数估计） 

31. 3 

41.4 

27. 3 

新教徒(用天主教徒的系数估计） 

20. 7 

38. 9 

40. 5 

天主教徒(用天主教徒的系数估计） 

16.5 

37.6 

45. 9 

失业者 

新教徒(用新教徒的系数估计） 

21. 1 

40.3 

38. 6 

新教徒(用天主教徒的系数估计） 

21.3 

39.5 

39.2 

天主教徒(用天主教徒的系数估计） 

16.3 

36. 3 

47.4 

居住于大家庭者 

新教徒(用新教徒的系数估计） 

28. 1 

40.0 

31.9 

新教徒(用天主教徒的系数估计） 

26.0 

39.0 

34. 9 

天主教徒(用天主教徒的系数估计） 

23.2 

38.6 

38.2 


注： * 用表 2. 13 和表 2. 14 的次序 logit 估计结果计算而得^ 


在轻度被剥夺的概率方面，如果新教徒的特征用天主教徒的 
系数进行评估，在单身父/母亲，或退休者，或失业者，或居住 
在大家庭的人中，新教徒的位置不变, [36] 但在那些不从事经 
济活动者中情况变差了。 
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新教徒和天主教徒在不同的剥夺类别中比例的差别， 
% —多；可以分 解为： 

= <9 ； -^；) + (^ ； -9；) =A ； + B ； 

[ 2 . 20 ] 

在方程 2. 20中，表示在天主教徒与新教徒的“剥夺 
差异”中因这两组人之间特征的差别而导致的部分，表示 
由系数值的组间差别而导致的部分。这些绝对差异可以用 
比例 表示： 


A , = A ； /( 只一汚）以及马=1 一 A [2.21] 

表2_ 17用百分比的形式，展 示了為和尽 的值。 

表 2. 17说明，对样本中所有个人进行计算，在那些没有 
被剥夺的天主教徒与新教徒之间，66%的剥夺差异 （g — 
是由于天主教次样本中的人具有与新教次样本中的人不 
相同的特征而引起的，34%是因为天主教徒特征的评估方式 
不同于新教徒特征的评估方式。至于严重被剥夺的情况，天 
主教徒一新教徒之间的差异有69%是由特征的不同造成的， 
但是在轻度被剥夺方面，只有55%的天主教徒一新教徒差异 
来源于特征差别。 

转向具体的分组，对那些单身父/母亲、退休者、失业 
者来说，在不同的剥夺程度上，相对来说较大比例的天主 
教徒一新教徒差异来自于两组人之间的特征差别。相对 
来说较小比例的差异是因为具体的一些特征，在应用到天 
主教徒身上时比应用到新教徒时具有更加严重的剥夺 
后果。 
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表 2. 17对天主教徒和新教徒间剥夺程度差异的贡献率* 



百分比贡献率 


特征差异 (4) 

系数差异(尽） 

总体 

没有被剥夺 

65. 8 

34. 2 

轻度被剥夺 

54. 7 

45. 3 

严重被剥夺 

69.4 

30. 6 

单身父/母亲 

没有被剥夺 

78.2 

21. 8 

轻度被剥夺 

64.4 

35. 6 

严重被剥夺 

77. 7 

22.3 

退休者 

没有被剥夺 

96. 1 

3. 9 

轻度被剥夺 

63. 1 

36. 9 

严重被剥夺 

85. 7 

14.3 

不从事经济活动者 

没有被剥夺 

28. 3 

71. 7 

轻度被剥夺 

33. 9 

66. 1 

严重被剥夺 

29. 4 

70. 6 

失业者 

没有被剥夺 

103. 0 

— 3. 0 

轻度被剥夺 

81. 7 

18. 3 

严重被剥夺 

93.5 

6. 5 

居住于大家庭者 

没有被剥夺 

58. 1 

41.9 

轻度被剥夺 

27.2 

72. 8 

严重被剥夺 

51.4 

48. 6 


注： * 用表 2. 16 的概率估计值计算而得。 


比如，对失业者来说，在严重被剥夺方面，94%的天主教 
徒一新教徒差异可以被这两组人之间特征的不同来解释。 
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但是，对不从事经济活动者来说，被用于评估特征的系数的 
差别(相对于特征本身的差异）解释了超过2/3的天主教徒 
与新教徒之间的剥夺差异。对于住在大家庭中的人来说，在 
严重被剥夺方面几乎一半的组间差异，以及在轻度被剥夺方 
面超过70%的组间差异，是由用于评估剥夺来源特征的系数 
的不同而引起的。 





多类别模型 
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第1节 I 简介 


前面考査了一组围绕着多元 (> 2) 结果事件的模型，且 
这些结果在本质上是次序的。在这一系列模型里面，因变量 
Y ,， 在对 个人； 界定这些结果时(对第一种结果 Y , = 1;对第 
二种结果 Y , = 2;以此类推，直到对第 M 个(最后一个)结果 
Yi = M ； i = 1, N )， 是一个离散的、有序的变量。估计 
这些模型的合适的方法是次序 logit 和次序 probit 。 这一部 
分关注的是结果没有次序的多元结果模型。多类别 logit 的 
方法论——对这组模型的适合的估计方法一在对职业选 
择的分析中进行解释并加以应用。多类别 logit 的一个重要 
特征(和局限)是无关选项的独立性 （ IIA )。 这一部分的结尾 
对这个特征以及怎样可能回避它的局限进行了讨论。 

一些真实事件为我们提供了非次序结果的例子。交通工 
具(乘坐巴士、火车或者小汽车）的选择就是一个明显的例子。 
其他非次序结果的例子包括职业选择(非技术的、技术的、专 
业的、管理的），居住地的选择(北边、南边、东边、西边），以及 
选举时的政党选择(保守党、自由党、工党）。上述例子的一个 
共有的词语就是“选择”。因为这些结果并没有什么本质上的 
好或者坏，因此可以认为个人是从可得到的结果的选项中选 
择最合适他们的结果。其实，效用最大化的框架为理解非次 
序多元结果模型的结构提供了一个很好的切人点。 
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第2节 I 随机效用模型 


给定 M 个选项(标记为^ = 1，…， M ) 中的一个选择，第 
;个人从第 ） 个选项中得出的效用可以表示为 14 。假设这 
个效用是 h 个因素(决定变量)的一个线性函数。在这 H 个 
因素中，假设有 R 个是针对个人且与选择的属性无关的 ， S 
个 (H = i ? + S ) 是针对选择而与个人无关的。比如，在选择 
上班的交通方式方面，一个个人特征可能是他/她并不住在 
火车站附近。这个人几乎不坐火车去上班的事实与火车这 
个交通方式的属性没有关系，而仅仅是这个人住在哪里的结 
果。另一方面，高峰期交通非常繁忙这个实际情况是汽车出 
行的一个属性，它降低了所有人坐汽车上班的效用。假设代 
表了第 i 个人的特征的这 R 个变量的值为 r = 1, 
i ?， 代表了第 j 种选择的属性的变量的值为 W ,,， 5=1, 

S 。 效用函数可以 写成： 

U , = + 2 7 is W JS + e , = Z ,+ e , [3.1] 

r = l j =1 

其中洛是对第 j 种选择与第 r 个特征 ( r = 1，…， i ?) 相 
关的系数， y « 是对第 i 个人与第 s 种属性1，…， S ) 相关 
的系数。 而且： 
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Z, = f^^x r + ^ 7is w is [3.2] 

r=l 5=1 

如果尽> 0,个人 i 第 r 个特征的值的增加，会导致 
他/她从选择 J 中得到的效用上升，如果艮 < 0则下降。如 
果 h > 0，选择 J /的第 s 种属性的值 W , s 的增加，对个人会 
导致效用的上升，如果）^<0则下降。但是，因为效用与它 
的决定变量之间的关系并不精确一比如，可能有些因素被 
排除在方程之外或者有些因素的测量不准确——方程中加 
入了一个误差项 e , 来捕捉这种不精确性。所以称为随机效 
用模型。 

当而且只有当在所有可利^3的选择中，第 m 种选择提供 
了最高程度的效用时 ，一 个人才会选择7 = m 。 也就是说，如 
果是一个随机变量，它的值）=1，…， M 表示个人 j 所做 
的选择，那么个人 〖会选 择选项 m 的概 率为： 

Pr(y, =m) = Pr(JJ im >%) 对所有 ） = 1 ， … ， iW, 且 ）尹 m 

^PrCZin + e,- ra +£j ) 

=>Pr(e s —e™ <Z im —Z i ) 对所有 ）= 1 ， … ， M ， 且）关 /n 
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第 3 节 | logit 模型的 类别： 

多类别 logit 与条件 logit 


麦克法登 （McFadden，1973) 已经证明过，如果 M 个误 
差项以 （_/+ = 1，…， M) 是以威布尔 （Weibull) 分布 F(e v ) = 
exp[exp(—e tf )] 独立同分布的，那么， 

Pr(Y ; = m )= e JP(D [3. 3] 

XJ^^expCZ,) 

用方程 3. 3 定义不同结果 j = 1， …， M 的概率的模型 
在这里称为广义 logit 模型。“广义”这个词表示模型同时包 
含了特征的作用和属性的作用，在方程 3. 1中分别为X,和 
W, s 。 在广义 logit 模型这个类别里面，还可以再细分为两 
小类： 

1. 多类别 logit 模型。这些模型只包含特征作用，所以 
对于它们来说方程 3. 1中所有的/,= 0. 实际上，这些模型 
在个人层次的 （individual specific) 数据中使用。 

2. 条件 logit 模型。这些模型只包含属性作用，所以对 
于它们来说方程 3. 1中所有的床= 0。实际上，这些模型在 
针对选项的 (choice specific) 数据中使用。 
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第4节 | 多类别 logit 模型 


这个多类别模型由方程 3. 3 定义但附带条件。现在，由 
于 h = 0， 


R 

Zij — [3. 4] 

r-1 

因为 Pr ( Y , = )) 概率对所有的选择来说总和为 1( 即 
Sf ^ PrCY , = D = 1)，只有 M — 1个概率可以独立决定。 
因此，方程 3.3 中的多类别 logit 模型是不定式，因为它是一 
个具有 M 个方程但只有 M -1 个独立未知数的体系。解决这 
个问題的实用的标准化方法是设定~ = 0, r = 1 ，…， i ?。 
在这个标准化下， Z n =0,所以由方程 3. 3: 


Pr(Y， = 1> = l+E^expCZ,) 


[3. 5a] 




[3. 5b] 


这个标准化的结果是，这些概率是唯一决定的,所以通 
过所采用的标准化方法，在方程 3. 5a 已经确定了 Pr(Y, = 
1 ) 后，方程 3. 5b 表示一个具有 M-1 个方程和 M-1 个独立 
未知数的概率 Pr(Y, = m) 的体系。 
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从方程 3. 5 a 和方程 3. 5 b 中，结果 j = k 与结果 j = m 
的概率比的对 数为： 

l d )= ^ (/5L H = Z^-Z, [3.6] 

那么这个风险比 ( risk - ratio ) 的对数（即结果 m 与结果々 
的概率比的对数，或者 log [ Prob(Yi = w )/ Prob ( y , =々)])并 
不取决于其他的选择。这个“风险比”，或者有时候称为相对 
风险—— ProbCY , = m )/ Prob ( Y , = k ) ——可以很容易地通 
过对风险比的对数取指数而计算出来。如果& = 1，那么风 
险比的对 数为： 

log ( p^y : T )) ) = 习成工= Z im ( m = 2 , M ) 

[3. 7] 

而风险比 则为： 

~ ^ = exp( '^^ mr X i .) = exp(Z^) (m = 2, •••, M) 

[3. 8] 

要把这个风险比与比数比 ( QR ) 区别开来，后者指 
的是一个结果的概率除以1减去那个结果的概率。 

因此，对 j = w ， 比率 比为： 

^ Pr(y, = m) Pr(y, = m) Pr(Y, = 1) 
m ~ 1- Pr(Y, =m)~ Pr(Y, = 1) 1 — Pr(Y, = m) 

= i ? R m Fr ( y , = 1) r „ q -] 

_ l - RR m Pr ( y , = 1) LJ - 

其中， QR „ 和分别为与结果 j 相关的比率比和 

风险比(后者以“基准”结果 j = 1 为参照）。 
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在二分模型中， RR 与 OR 没有区别， 因为基 准结果 
1==1就是兄关爪。在大于两种可能结果的模型中，结果 
Y ,. = 1与 Y , 关 m 是不一样的。所有 logit 模型的固有方法 
就是用一个结果与某个基准结果的可能性的比率表示分析 
结果——也就是，计算 RR 。 但是在二分模型中，就是 
QR ， 所以在这种模型中分析结果是用后者表示的。另一方 
面，在多类别 logit 模型中，由于与 OJ ? 不一样，因此分析 
结果用表 ZK 。 


估计与预测 


因变量1，…， iv ) iv 种观测值中的每一个都视为 
从一个有 Af 个结果的多项分布中的一次单一的抽取。定义 
虚拟变量& = 1，如果个人 i 选择 j ，否则馬= 0, ） = 1，…， 
M 。 则观察到这个样本的概 率为： 

N M N M 

L= nn [Pr(Y, = j)J^logL= 2 =7) 

1 = 1 }=\ J = 1 > =1 

[3. 10] 

其中 Pr ( Y , = j ) 如果 = 1 的话由方程 3. 5 a 定义，如果 
j > l 的话由方程 3.5 b 定义。参数估计值^0 = 1, -, M , 
r = 1，…， i ?) 的选择是为了使似然函数最大化(方程 3. 10)。 

给定这些估计值，对每个个人 t '= 1， …， N ， 我们可以使 
用方程 3. 4,对每种结果7 = 1，…， M 用 及/代替馬 ，产生 
4的估计值。然后，使用这些估计值，可以从方程 3. 5 a 
和方程 3. 5 b 中计算出预测到的概率 p,,i=l, N,j = 
1，…， M 。 注意对每个人来说，对所有的结果估计出来的概 
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率必须总和为1, s h =1 »多类别 logit 模型的一个特点 
就是，对每个结¥估计出来的个人概率的平均数 （A = 
S P ,, } = 1 , …， iW)， 等于实际观察到的在这个结果类别 

t=l 

中的人所占的比例。 

另一种从多类别 logit 模型中预测概率的方法是对每个 
结果 j = 1，…， M， 对所有人计算忑的均值，如 下： 

t =1 r 二 1 

= [3.11] 

r = l i' = l r = l 

然后计算估计到的概率 如下： 


z^ ex p ( 乏 ) 


[3. 12a] 


exp(Zj) 

i + 2 二 2 ex p<^) 


m = 2，…， M [3. 12b] 


通常 ， H 多 1 ， P 2 ■> P 3 ^ 这并不奇怪，因为 
虽然为和 PjCj = l , 2, 3) 两者都旨在测量不同结果的整 
体概率，但是它们的计算方法非常不同。 A 计算为估计到的 
个人概率 f #的均值，而^^是从个人决定变量的值中计算 
出来的。而另一方面， A 绕过了个人的概率，而用个人4 
的平均值之计算（或者同等地，用决定变量的均值 
计算）。 


边际效应 


决定变量的值的一个小变化对不同结果概率的边际效 
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应这个问题可以用两种不同的方法表达。的一个小变化 
(对个人 i 第 r 个决定变量的值），对某个结果 m 在如下两点 
上会带来什么变化呢？ 

1. 概率 Pr ( Y , = m ) 

2. 风险比 Pr ( Y , = m )/ Pr ( y , = 1) 

第二个问题相对来说比较容易回答，但是第一个问题则 
难得多。先从简单的问题开始，由方程 3. 7， 

— log ( Prob(Y ' 

aX,. g VProb(Y, = l) / ^ 

因此，对 X , 的一个小变化，风险比的变化方向可以从相 
关系数的符号中推断出来;如果&>0则 m 的相对概率 
增加，如果 iSL <0 则减少。 

但是，对的一个小变化，观察到结果 j = 771的概率 Pr 
( Y ,= m ) 其方向的变化，无法从&的方向上推断出来。原 
因是，在多类别模型中，某个特定个人某变量值的变化会影 
响他/她每一种结果的概率。因为这些概率被限定总和为1， 
Pr ( Y ; = m ) 上升还是下降取决于其他概率的变化情况。所 
以实际上它不仅取决于&的方向，还取决于该系数相对于 
与该变量相关的其他系数的大小情况，即相对于尽 j = 
1， ."， M , 因此， 3 Pr o &( Y ； = •不一定与卢咖 

的方向相同。 

在多类别模型中，确定某变量值的变化对结果概率的影 
响的最有效的方法是，在其他变量的值保持不变的情况下， 
比较变化前与变化后的概率。当分析的决定变量是一个虚 
拟变量时，这种方法最有效。如果第 r 个变量是个虚拟变 
量，因此 X , = 1或者= 0,那么首先假定对所有人 X ,= 
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1，并用方程 3. 4对每个结果/=1，…， M 估计&，把这个估 
计值称为乏然后,其他条件相同假定对所有人0, 
对每个结果 J = 1，…， M 估计&，把这个估计值称为 f :， 
注意 $ = 21 + 1。 

用方程 3. 5 a 和方程 3. 5 b 计算概率的预测值，首先用 
z ', = 计算出乂）,然后用 4 =乏°/计算出％)。对 

所有人计算平均概率，式= 2] 二以和 K 二 K 。九 1 

与 P ; 之间的差就是对所有人，第 r 个变量的值的变化对观 
察到结果= 1，…， M ) 的概率的“平均”作用。 

在分析某变量的值变化时，另外一种保持其他变量值不 
变的方法是把它们的值设为均值，元= T / LxdN ， 然后 
定义： 

Z )=^ + ^ X s 和 $ = 2 ft 尤 [3.13] 

s^r s^r 

然后用方程 3. 5 a 和方程 3. 5 b 计算概率的估计值，先用 
2, = Z ； (计算出&)，然后用 =3( 计算出 0。与 
P ) 之间的差就是对“平均个体”(定义为对所有变量，其值都 
为平均值的个人），第 r 个变量的值的变化对这个人来说，观 
察到 结果只 j = 1，…， M ) 的概率的作用。 

某个决定变量其值的变化对风险比的影响要简单得多。 
从方程 3. 7, = 1和= 0的风险比对数的差别，为 

Z \ —21= 身>，所以对应的风险比的差别为 exp ( 爸》 。这 
样，某个系数的指数值表示的就是对某个决定变量一个单位 
的变化(对该结果)所带来的风险比的变化。当然，对虚拟变 
量来说，考虑一个单位的变化是最合适的。 
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第5节 | 应 用:职 业获得 


方程设定 

作者参考的是从英国1991普查中抽取出来的，关于 
25—45岁全职男性雇员的职业分类（以及其他特征）的信 
息。 [37] 职业的分类为非技术/半技术工人 ( UNS ) 、 有技术体 
力/非体力劳动者 ( SKL ) 和专业/管理/技术人员 （ PMT )。 


表 3. 1男性全职雇员的样本统计值 :按种 族类别划分- 



白人 

黑人 

印第安人 

样本量 

96297 

863 

1572 

年龄(年） 

35.4 

32.6 

34.9 

%职业类别 

专业/管理/技术人员 (PMT> 

41.7 

29.3 

35. 1 

有技术体力/非体力劳动者 (SKL) 

40. 7 

50.2 

39.8 

非技术/半技术工人 (UNS) 

17.6 

20.5 

25.2 

%具 18 岁或以上的文凭 

学位文凭 

15. 1 

7. 9 

17.4 

副学位文凭 

9.2 

7. 1 

6.6 

没有 18 岁或以上的文凭 

75. 7 

85.0 

76.0 

%出生在 

英国 

96.2 

54.6 

7.6 

国外 

3.8 

45.4 

92.4 

%居住在 

伦敦 

10.1 

51.5 

43.6 

北部 

50.3 

24.9 

30. 2 

南部 

39.6 

23.6 

26.2 


注：*信息来自英国 1991 年人口普査。 
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在这98732个人当中，有96297个“白人”，863个“黑人” 
和1572个印第安人。表 3.1 显示了样本统计量的主要特征。 
这张表非常清楚地说明，职业地位在白人、黑人和印第安人 
之间存在着差别。比如说，42%的白种男性雇员的工作属于 
PMT 类别，但只有35 %的印第安人，以及29%的黑人从事类 
似的工作。这些差别并不能被特征的差别解释 掉:与 15%的 
白种工人相比，17%的印第安雇员有学位文凭。 

依据前面阐述的选择构成，看上去白人、黑人和印第安 
人在做选择时面临不同系列的限制。这可能是因为，与具有 
同等资格的白人相比，处于少数民族组别中的个人在劳动力 
市场上面临着劣势。也可能是因为与白人相比，处于少数民 
族组别中的个人具有更不利的劳工特征(此后称之为特征）。 
因此，职业表现的组间差别可能同时是种族与特征不利因素 
的结果。 

关键问题是 ：这些 差别中有多少是种族不利因素的结 
果，又有多少归因于特征的不利因素？前一部分所描述的多 
类别 bgit 方法可以用来回答这个问题。 

起点是对样本中每个〖=1，…，98732男性定义因变量 
Y , 以使： 

Y , = 1如果这个人受雇于 UNS 职业 类别； 

V . =2如果这个人受雇于 SKL 职业 类别； 

Y ,= 3 如果这个人受雇于 PMT 职业类别。 

在这个多类别模型设定中使用的决定变量 包括： 

年龄 

AGE 以年计 算：通 过设定25岁的人 AGE = 0进行 
标准化。 
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教育 C 3« 

HED = 1，如果这个人有学位程度文凭，否则 HED =0, 
MED = 1,如果这个人有高于 A 程度文凭 （ post-A lev ¬ 
el ) ，但低于学位 文凭; 否则 MED = 0。 

学习领域 [39] 

SCI = 1，如果为自然科学相关 领域; 否则 SCI = 0； 

BUS = 1，如果为商学相关 领域; 否则 BUS = 0。 

种族 [40] 

BLK = 1,如果这个人的种族为加勒比黑人，否则 
ELK = 0； 

IND= 1，如果这个人的种族为印第 安人； 否则 
IND = 0。 

出生国家 

OVB= 1,如果这个人在英国以外 出生; 否则 OVB = 0。 
居住地区[ 41] 

STH= 1，如果住在英国南部 [42] (伦敦除外），否则 
STH = 0； 

NTH = 1，如果住在英国北部; [43] 否则 NTH = 0。 
以这些变量为基础，那两个风险比（对数）方程(方程 3. 
7,对 j = 2， 3) 确定 如下： 

log ( pr ( ( y | = i )) =吻 见尺,+ 心 * 脚.+印* ora ; 

+Pji * BLKi * (WBi + y^ * INDi * 

+ o^2 * HEDi + 具 2 * BLKi * HEDi 

~\~7j2 * INDi * HEDi +a>3 * MEDi 
. 岛 3 * ELK, * MEDi + 7>3 * INDi * MED { 
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+ a j4 ^ 

央 NTHi +知 *ELK ( 

*NTH, 


+ />4 . 

光 INDi * NTHi + a >5 

*STH ( 


+ ^5 ^ 

^BLK^STH. + r.s 

* IND { * 

STH, 

+ 为 1 ^ 

^ M}E i +d i 2 * AGE 2 +6 fl ^ BUS, 

+忿4 ^ 

^sch+e^^EUs,* 

HED, 


+ 久 6 ^ 

^ SC/ t * HEDi 


[3. 14] 


J = 1这个结果——也就是，处于 UNS 这个职业类 
别——在此后称为“基准”结果。这个结果的系数被设定为 
等于0,其他结果的风险比定义为关于这个基准结果概率的 

风险比。 [44] 

在方程 3. 14 中，％ 是“白人”的系数，各和心分别表示由 
于是黑人和印第安人，而对这些系数的附加的贡献。另一方 
面，4是假定没有“种族维度”的系数，意即它们（被假定）在 
种族方面没有变化。从方程 3. 14,对一个25岁 （AGE = 0)， 
英国出生的 (OVB = 0) ，白种 (BLK = IND = 0) 男性雇员，且 
没有18岁或以上的文凭 （ HED = MED = 0)，居住在伦敦 
(NTH = STH = 0)，其风险比对数为印。如果有这么一个 
人是黑人或者印第安人，那么他的风险比对数会分别变化岛。 
和 7)。 ，分别变为：（£^。+ /%。 ） 和 ( a j0 + 7, o ) 0 

举例来说，如果洳< 0,那么处于职业 类别） 的概率相对 
处于 UNS 类别的概率的比率，对一个白人来说会比具有同 
等条件的黑人要高。 系数办 和心的大小测量了黑人与印第 
安人相对于白人来说，（在职业类别 j 方面）面临的“种族不 
利因素”的程度，在如上描述的特征的情况下。 [45] 方程 3. 14 
中的交互项，涉及种族变量 BLK 和 IND ， 允许种族不利因素 
的程度随着个人的某些非种族特征而变化。这些非种族特 
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征为出生国家、居住地区和文凭程度。对具有上述特征的男 
性来说，处于职业类别 j 的风险比对在国外出生的 （OVB = 
1) 白人来说是 M + c ^， 对在国外出生的 （ OVB = 1) 黑人来 
说是吻 -\-aji + 择。+/%1。 

方程 3. 14包含的非种族特征交互项中，其中有一系列 
是学习领域和文凭程度之间的交互作用。这些交互项的相 
关系 数为心 和心，且其值不等于0。这意味着，在决定风险 
比的值时，不仅学习领域和文凭程度在分开考虑时有重要影 
响; 而且学科与文凭是如何融合而产生作用也很重要，如一 
个具有自然科学相关学位的毕业生。 

方程统计量 

对方程 3. 14的估计，首先对它的系数没有附加任何限 
制，然后限定它的某些系数为0。方程 3. 14 —共包括48个 
系数，在 SKLC ^ = 1) 和 PMT(j = 2) 这两个方程中分别各占 
24个。在这48个系数中，有13个被设为0。这些设为0的 
系数，各自并不显著地不等于0，而且，似然比检验 Z 2 ( 13 ) = 
8. 1，并没有拒绝它们全部等于0的联合假设。表 3. 2和表 
3.3 分别表示，在没有附加任何限制和附加了零限制的情况 
下，对方程 3. 14的估计结果。对这些没有限制和有零限制 
的结果的比较显示，附加零限制并没有在本质上影响 （ quanl - 
itatively affect ) 那些没有被设为0的系数的估计值。表 3. 2 
和表 3. 3中的 z - ratios 是估计系数相对于它们的估计标准误 
差的比率。在相关系数等于0的零假设下，这些 z - ratios 渐 
进地服从 iV (0, 1) 分布。[ 46 ] 
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表 3. 2职业选择的多类别 logit 估计结 果:完 整模型 


Multinomial Regression Log Likelihood = —86948. 078; Number of obs = 98732 ； 
LRX 2 (46) = 30880. 36 ； Prob = 0. 0000 ； Pseudo R 2 = 0.1508 


y 

Coefficient 

Standard Error 

z 

P> Ul 

[95% Conf. Interval] 

尸 2 

age 

0. 0261899 

0. 0064884 

4.036 

0. 000 

0.0134729 

0. 0389069 

age2 

-0. 0009772 

0. 000306 

-3.194 

0. 001 

—0. 0015768 

-0. 0003775 

blkcb 

0. 3655553 

0.1672964 

2.185 

0.029 

0. 0376603 

0. 6934503 

blkovs 

0. 08195 

0.1887671 

0.434 

0.664 

—0. 2880266 

0. 4519266 

ind 

0.4707812 

0. 2790797 

1.687 

0.092 

-0. 0762051 

1.017767 

indovs 

-0. 6064709 

0. 2728072 

-2. 223 

0.026 

-1.141163 

-0.0717786 

ovsbn 

-0.109104 

0.0540097 

-2.020 

0.043 

-0.214961 

-0.003247 

north 

-0.1445068 

0.0355612 

-4.064 

0. 000 

-0.2142055 

-0.0748082 

indnth 

-0.4185296 

0.1586727 

-2. 638 

0.008 

-0. 7295225 

-0.1075368 

blknth 

—0.7146398 

0. 2170033 

-3. 293 

0.001 

-1.139959 

—0. 2893211 

south 

-0.0776431 

0. 0365635 

-2.124 

0.034 

-0.1493062 

—0. 0059799 

indsth 

-0.3459856 

0.1654501 

-2. 091 

0.037 

-0.6702619 

-0. 0217094 

blksth 

-0. 6664942 

0. 225652 

-2.954 

0. 003 

-1.108764 

-0. 2242244 

highed 

1.083631 

0.1822909 

5.945 

0. 000 

0. 7263477 

1.440915 

indhe 

-0.2140724 

0. 4490211 

-0.477 

0.634 

-1.094138 

0. 6659928 

blkhe 

-1.26384 

0. 7230326 

-1. 748 

0.080 

-2. 680958 

0.1532775 

mided 

0. 6060102 

0. 2709862 

2. 236 

0. 025 

0. 0748871 

1.137133 

indme 

-0. 3332887 

0.4428193 

-0. 753 

0. 452 

— 1.201199 

0.5346213 

blkme 

0.9548953 

1.034856 

0.923 

0. 356 

— 1.073386 

2.983177 

subbus 

1. 205355 

0. 3189165 

3.780 

0.000 

0. 5802901 

1. 83042 

subsci 

0. 5103959 

0. 2820694 

1.809 

0.070 

-0.0424499 

1.063242 

bush 

-0. 6332213 

0. 4138681 

-1.530 

0.126 

-1.444388 

0.1779454 

scih 

—0. 795496 

0. 3545109 

-2. 244 

0.025 

-1.490325 

-0.1006674 

_cons 

0. 7755227 

0. 042255 

18.353 

0.000 

0. 6927043 

0. 858341 

y o 

age 

0. 0893431 

0. 0073103 

12. 222 

0.000 

0. 0750152 

0.103671 

age2 

-0. 0024609 

0. 0003397 

-7.244 

0.000 

-0. 0031266 

-0. 0017951 

blkcb 

-0.0672642 

0.1950314 

-0. 345 

0. 730 

-0. 4495187 

0. 3149904 

blkovs 

-0. 5708287 

0. 2236755 

-2.552 

0. 011 

-1.009225 

-0.1324329 

ind 

0. 0918407 

0.3348558 

0. 274 

0.784 

—0. 5644646 

0. 748146 

indovs 

-0. 7893394 

0. 3292557 

-2.397 

0.017 

-1.434669 

-0.1440101 

ovsbn 

0. 0932756 

0.0565007 

1.651 

0.099 

-0.0174637 

0. 204015 
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续表 


Multinomial Regression Log Likelihood — —86948.078; Number of dfs = 98732? 
LRX 2 (46) = 30880. 36? Prob>7? = 0. 0000; PseudoR z = 0.1508 


y 

Coefficient 

Standard Error 

z 

P> kl 

[95% Conf. Interval] 

north 

-0.6113055 

0. 037637 

-16. 242 

0. 000 

—0. 6850727 

—0. 5375384 

indnth 

一 0. 4696822 

0.1943706 

-2. 416 

0.016 

—0. 8506416 

一 0.0887228 

blknth 

-0. 1352359 

0. 2598729 

—0. 520 

0.603 

-0. 6445774 

0. 3741057 

south 

-0. 1697707 

0. 0383309 

-4. 429 

0.000 

一 0.244898 

-0. 0946434 

indsth 

-0. 5134623 

0.1951871 

-2. 631 

0.009 

—0. 8960221 

-0.1309025 

blksth 

-0. 418329 

0. 268549 

-1.558 

0.119 

-0. 9446753 

0.1080174 

highed 

3. 877128 

0.1713991 

22. 620 

0. 000 

3. 541191 

4. 213064 

indhe 

-0.1698475 

0. 4062421 

-0.418 

0.676 

-0. 9660674 

0. 6263724 

blkhe 

—1.139974 

0. 6128429 

-1.860 

0. 063 

-2. 341124 

0. 0611758 

mided 

2. 850769 

0. 2490918 

11. 445 

0. 000 

2. 362558 

3. 33898 

indme 

—0. 2049551 

0. 4154452 

-0. 493 

0. 622 

-1.019213 

0. 6093026 

blkme 

0. 743211 

1. 023254 

0. 726 

0. 468 

-1.262329 

2.748751 

subbus 

0. 8151578 

0. 298235 

2.733 

0.006 

0. 230628 

1. 399688 

subsci 

0. 2500103 

0. 2599529 

0. 962 

0.336 

-0. 2594879 

0. 7595085 

bush 

-0. 0414593 

0. 3898265 

-0.106 

0.915 

-0. 8055052 

0. 7225865 

scih 

0.1600076 

0. 3281777 

0.488 

0.626 

-0.4832088 

0.803224 

_cons 

-0. 0164003 

0.0462775 

-0. 354 

0.723 

-0.1071026 

0. 0743019 


注：因变量: y = 1 为对照组。 

表 3.3 职业选择的多类别 logit 估计结 果：限 制模型 


Multinomial Regression Log Likelihood — — 86952.126; Number of obs = 98732; 
Li? Z 2 (33) = 30872.27; Prob>X 2 = 0. 0000 ； PseudoR 2 =0.1508 


y 

Coefficient 

Standard Error 

z 

P> kl 

[95% Conf. Interval] 

: V = 2 

age 

0. 026323 

0. 0064795 

4. 062 

0.000 

0. 0136234 

0. 0390227 

age2 

-0. 0009813 

0, 0003057 

-3. 210 

0.001 

-0. 0015805 

-0. 0003822 

blk 

0. 426683 

0.1116093 

3.823 

0.000 

0. 2079328 

0. 6454332 

blkovs 

(dropped) 






ind 

0. 4144723 

0. 2152989 

1.925 

0,054 

—0. 0075059 

0. 8364504 

indovs 

-0. 565894 

0. 2215624 

—2. 554 

0.011 

-1.000148 

-0. 1316396 

ovsbn 

-0.106519 

0.05151 

—2.068 

0.039 

-0. 2074767 

-0.0055613 



第 3 章多类别模型 


75 


续表 


Multinomial Regression Log Likelihood = —86948. 078 ； Number of obs = 98732 ； 
LRx 2 (AS) = 30880. 36 ； Prob>^ = 0.0000 ； PseudoR 2 =0.1508 


y 

Coefficient Standard Error 

z 

P> Ul 

[95% Conf. Interval] 

north 

-0.1438706 

0. 0351996 

—4.087 

0.000 

-0. 2128606 

—0. 0748806 

indnth 

-0.4152823 

0.1546391 

-2. 685 

0.007 

—0. 7183694 

-0.1121952 

blknth 

-0.6568392 

0.1761849 

-3.728 

0. 000 

-1.002155 

-0.3115232 

south 

-0.0765746 

0. 0362333 

-2.113 

0.035 

-0.1475906 

—0. 0055585 

indsth 

—0. 3417737 

0.1632409 

-2. 094 

0.036 

—0. 66172 

-0. 0218275 

blksth 

-0. 6677784 

0. 2086548 

-3. 200 

0.001 

-1.076734 

-0. 2588226 

highed 

1. 373433 

0. 1088435 

12.618 

0.000 

1.160104 

1. 586763 

indhe 

blkhe 

(dropped) 

-1.312484 

0. 7222905 

-1.817 

0.069 

—2. 728147 

0.1031797 

mided 

0. 8347366 

0.1476385 

5.654 

0. 000 

0. 5453704 

1.124103 

indme 

blkme 

subbus 

(dropped) 

(dropped) 

0. 9348005 

0.1923779 

4.859 

0. 000 

0_ 5577467 

1.311854 

subsci 

0. 2707989 

0.1355025 

1.998 

0. 046 

0. 0052189 

0. 5363788 

bush 

—0. 6003602 

0.1675312 

-3.584 

0. 000 

-0.9287153 

-0. 272005 

scih 

-0. 9608239 

0.1601125 

-6. 001 

0.000 

-1.274639 

-0. 6470093 

_cons 

0. 7737729 

0. 041826 

18. 500 

0. 000 

0.6917954 

0. 8557504 

y o 

age 

0.0895118 

0.0073026 

12. 258 

0. 000 

0.0751989 

0.1038247 

age2 

—0.0024658 

0.0003395 

-7.263 

0. 000 

-0.0031313 

-0.0018004 

blk 

blkovs 

(dropped) 

-0.6781675 

0.154667 

-4.385 

0. 000 

-0. 9813092 

-0. 3750257 

ind 

indovs 

(dropped) 

—0. 7063556 

0.1295174 

-5. 454 

0.000 

一 0. 9602051 

—*0.4525062 

ovsbn 

0.0954136 

0.0553704 

1.723 

0.085 

-0.0131104 

0. 2039377 

north 

-0.6105677 

0.0368792 - 

-16. 556 

0.000 

-0. 6828497 

-0. 5382858 

indnth 

-0.4542501 

0.181704 

—2. 500 

0.012 

—0. 8103834 

~0. 0981168 

blknth 

south 

(dropped) 

-0.1682364 

0. 0376312 

-4.471 

0. 000 

-0. 2419921 

-0. 0944807 

indsth 

-0. 501347 

0.1887684 

-2. 656 

0.008 

-0. 8713262 

-0.1313678 

blksth 

-0. 4365967 

0. 2228379 

-1.959 

0.050 

-0. 8733511 

0. 0001576 

highed 

4.171942 

0. 0844821 

49. 383 

0.000 

4.00636 

4. 337524 
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续表 


Multinomial Regression Log Likelihood = —86948. 078 ； Number o f obs ~ 98732( 
LRX 2 W) = 30880. 36 ； Prob>/ = 0.0000; PseudoR 2 =0.1508 


y 

Coefficient 

Standard Error 

z 

P> kl 

[95% Conf. Interval] 

indhe 

(dropped) 






blkhe 

-1.198389 

0. 6072452 

-1.973 

0.048 

-2. 388567 

-0.0082099 

mided 

3.089609 

0. 0695418 

44.428 

0. 000 

2. 95331 

3. 225909 

indme 

(dropped) 






blkme 

(dropped) 






subbus 

0. 5326858 

0.1343444 

3.965 

0.000 

0. 2693757 

0. 795996 

subsci 

(dropped) 






bush 

(dropped) 






scih 

(dropped) 






_cons 

-0.0188423 

0.0454545 

-0.415 

0.678 

-0.1079314 

0.0702469 


注:因 变量: y = 1 为对照组。 

Mlogit ： likelihood ratio test X 2 (13) = 8. 1 ； Prob〉/= 0. 8372 。 


估计值 


正如前面的讨论所强调的，表 3. 2和表 3. 3中系数估计 
值的方向反映了在其他条件同等的情况下，对应于该系数相 
关变量值的变化，风险比 Pr ( Y , = j )/ Pr ( Y , = 1) 的变化方 
向。它并不反映单个概率 Pr ( Y , ) 的变化方向。在这一 
部分中报告的估计结果是表 3. 3中的约束系数。这是因为， 
当把完整的方程设定（见表 3. 2) 应用到数据中时，我们发现 
这些变量只有一小部分对风险比有显著的影响。在大多数 
情况下，被排除在外的变量是那些涉及某个非种族变量 X 与 
种族变量 BLK 和/或 IND 的交互项。这意味着当变量 X 本 
身对个人/属于某个特定职业类别的风险比有显著影响时， 
这个人属于哪个种族并不会改变这种影响。 
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表 3. 3所示的估计结果，点出了三种对改善个人处于 
SKL 或 PMT 职业类别风险比来说很重要的特征: [47] 

住在 伦敦； 

具有18岁或18岁以上的文凭，如果取得学位或学习与 
商业相关的科目会 更好； 

出生在英国。 

住在伦敦有两点 好处: 首先，对所有人有一个整体的益处。 
这来源于如下 情况: 居住在北部或者南部的男性，在其他条件相 
同时，与居住在伦敦的人相比，其处于 SKL 或 PMT 职业类别的 
风险比更低 [48] (方程 3. 14中心 4 , “<0, ） = 2, 3)。其 
次，对黑人和印第安人来说还有特定的好处。因为住在伦敦 
而不是在伦敦之外，黑人和印第安人与白人相比，在处于 SKL 
或 PMT 职业类别的风险比上具有更大的提升。相比于住在伦 
敦，住在伦敦之外的人其处于 SCL 或 PMT 职业类别的风险比 
的下降程度，对黑人 [49] 或者印第安人比对白人更大（瓦 4 ，瓦 5 ， 
7,4 > ?)5<0, j =2 以及瓦5 ， j = 3)。 

从这种意义上说，相对于白人，伦敦比英国其他地区对 
印第安人和黑人更加友善。特别是住在伦敦的印第安人 
( NTH , = STH , = 0)，并不比白人在处于 PMT 职业类别的 
风险比方面具有劣势，因为= 0, j = 3。住在伦敦之外 
( NTH , = 1) 对所有人这个风险比都下降，但是对印第安人 
来说下降程度要比对白人更大。从这种意义上说，在 PMT 
职业类别中，印第安人在伦敦相对于白人所享受的种族同等 
情况，在伦敦以外的地区减 弱了。 “伦敦效应”对黑人最有 
利。在全职男性雇员中，只有10%的白人住在伦敦，但有 
44%的印第安人和53%的黑人住在这个地区。 
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出生在英国之外一直是一个劣势 :处于 SKL 或 PMT 职 
业类别的风险比对英国出生的人比在国外出生的人更大(方 
程 3. 14中<0, j = 2, 3)。但是，因为出生地这个变量 
与种族的交互项是负的（瓦1 y fl <0 ,j = 2, 3)，出生在国外 
的劣势对印第安人和黑人来说，要比白人更大，即由于出生 
在国外而导致的风险比的降低程度对印第安人和黑人比白 
人更大。 

拥有18岁或18岁以上的文凭，不管是副学位还是学位 
(或更高)文凭，两者都提高了处于 SKL 或 PMT 职业的风险 
比,其中学位文凭的作用比副学位文凭的作用更大。 

除了文凭之外，所取得文凭的科目也有重要作用。商业 
类科目的文凭为进人 SKL 和 PMT 这两种职业都提供了最 
好的途径。计量经济学的结果是对男性印第安人来说，方程 
3. 14 中的 & ( HED ) 和 办 （ MED ) 在 SKL (j = 1 ) 和 
PMT(j = 2) 这两种职业中都显著地等于 0。 对男性黑人来 
说，在 PMT 职业类别中 你 （ HED ) 明显是负的。男性黑人相 
比印第安人或白人来说，具有更低的学位文凭回报率，但是 
印第安人和白人的回报率相同。 

相关文献指出，那些在自己的国家获得文凭的移民，尤 
其是从发展中国家来的移民，持有这样一种观念(不管是否 
有理） :这些 文凭与在接收国家获得的同等文凭相比，更“没 
有价值”。遗憾的是，我们的数据并没有对那些出生在国外 
的人，记录他们迁人英国的时间。因此，虽然我们知道样本 
中大部分黑人和印第安人出生在国外(表 3. 1)，但是却没有 
关于他们到达英国时的年龄方面的信息，这意味着，我们无 
法推断他们在哪里获得他们的18岁或18岁以上的文凭(如 



第 3 章多类别模型 


79 


果有的话）。 

概率估计值 


利用估计出来的 A —记住 A = S 二 hxi 是 

用表 3. 3中的估计值和每个人的决定变量的值联合估计出来 
的 一 STATA 会通过计算方程 3. 5 a 中的彡„和 3. 5 b 中的彡 2 
和对样本98732个人中的每个人估计处于三种不同职业 
类别的概率。对所有人，以及对白人、黑人和印第安人这三组 
人，分别计算出来的这些个人概率的均值,分别记为无，^5, 
心和 = 1，2, 3)。如表 3. 4所示,这些平均概率(估计到 

表 3. 4白人、黑人和印第安人处于不同职业类别的概率估计值* 


概率估计值 



UNS 

SKL 

PMT 

个人概率估计值的均值 

总体 

17. 7 

40.8 

41.5 

白人 

17.5 

40. 7 

41.8 

黑人 

20.5 

50.2 

29.3 

印第安人 

25. 1 

39. 8 

35. 1 

用决定变量的均值计算而得的概率估计值 

总体 

14.3 

41.8 

43.9 

白人 

14.2 

41. 7 

44. 1 

黑人 

19. 6 

52. 0 

28.4 

印第安人 

22.0 

43. 3 

34. 7 


注 ： * 用表 3. 3 的多类别 logit 估计结果计算而得。 
UNS= 非技术/半技术工人。 

SKL = 有技术体力/非体力劳动者。 

PMT = 专业/管理/技术人员。 
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的个人概率的均值）表示，比如，对所有男性雇员和白人，黑 
人以及印第安男性雇员估计到的处于 PMT 职业类别的平均 
概率分别为 41. 5%, 41. 8%, 29. 3%和 35. 1%。应该强调 
的是，对所有人和对每个种族组别内的个人所估计到的处于 
三种职业类别的平均概率，正好等于所对应的每个分类的样 
本比 例。™ 

这是多类别 logit 模型的一个特点，估计到的个人结果概 
率的均值总是等于这些结果的样本比例。 

估计概率的另一种方法是对所有人，以及对白人、黑人 
和印第安人这三组人计算乏 4 的均值。如果这些均值分别记 
为 Zj ， 2*5 ，， Zg ，那么方程 3. 12 a 就可以用来对所有人和 
每一组人计算第一种结果的概率 A ， Pm ， 乒 bi 和 P n )， 方 
程 3. 12 b 就可以用来对所有人和每一组人计算第二种和第 
三种结果的概率化， Pw ,, 戶场和卢 5 0 = 2, 3)。 [51] 这些概 
率，如表& 4所示(用决定变量的均值估计的概率），显示在 
决定变量为均值时，所有人、白人、黑人和印第安男性雇员处 
于 PMT 职业的概率估计值分别为 43. 9%, 44.1%, 28.4% 
和 34. 7%。 

这些概率估计值与该表上半部分报告的概率不一样， 
这并不奇怪。举例来说，虽然 fury 和 Pwj 0 = 1» 2 , 3) 两 
者都旨在测量白人处于不同职业类别的总体概率，但是他 
们的计算方法非常不同。是（对96297个白人）估计到 
的个人概率的均值，而多#是用个人决定变量的值计 
算出来的。另一方面，——绕过了个人概率——反而 
是用样本96297个白人的均值么 r , 计算出来的。因 
此，总的来说，对任何组别尽，关 p gl ； ^ p ^, 
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■Pg3 尹 P «3 。 


通过模拟获取边际效应 


在之前的讨论中，我们强调了对；^的一个小变化观察 
到结果 j 的概率 Pr ( y , = j ) 的变化方向不能从疼的方向中 
推断出来，因为 3 Prob ( y , = j )/3& 不一定与戽的方向相同。 
在多变量 logit 模型的情况下，只有风险比的变化方向能从系 
数的方向中估计出来。因此，前面对估计结果的讨论就是关 
于这些风险比的。 

但是，可能有人会对概率 Pr(Y, =j) 而不是相对于某个 
基准结果的风险比 Pr(Y, = j)/Pr(Y, = 1) 感兴趣。在这个 
应用实例中，可能有人会对处于某个具体职业类别的概率在 
不同的种族间如何存在差别特别感兴趣。由于系数估计值 
并不直接对此给出答案，一种可以替代的方法就是通过模拟 
的窗口观察这些结果。我们可以通过计算在不同的假设情 
形下不同结果的概率而使模型的结果变得清晰明显。 [53] 更 
具体地，种族的作用可以通过比较当种族虚拟变量取不同值 
时的概率分析岀来，在做这些比较时其他变量的值保持 
不变。 

假设样本中所有98732个人都是白人，即对所有；= 
1，…， N ， IND ,= BLK t = 0。让 Pf 表示在这个假设情形 
下个人£处于职业类别只）=1，2, 3) 的概率。现在假设样 
本中所有的98732个人都是黑人，即对所有 i = 1，…， N , 
BLK , = 1，让 Pf 表示在这个假设情形下个人 i 处于职业类 
别只 j = 1，2, 3) 的概率。「 5 «根据方程 3. 14的设定，这两个 
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概率和 Pf 是当样本中所有人的特征分别用白人(％)和 
黑人的系数(％+疼)进行评估时的结果。此后称它们为“种 
族”概率，因为它们是用只在种族特征上不同的个人所组成 
的样本计算出来的。当应用到方程 3. 5 a 和方程 3. 5 b 时，系 
数估计值和^和 a % + ^产生种族概率的估计值 PJ 
和4。 

如果碎=/>； = SLK / n 是个人概 
率估计值各自的均值(其中后者是在两组假定的情形下计算 
出来的）。那么，种族概率的均值^ " 和之差就完全是应 
用于(样本中 N 个人)给定特征时，不同系列的系数（白人和 
黑人)之间差别的结果。因此，这些差异可以完全归因于对 
这两组人不平等对待的结果，而这两组人除了种族不同，在 
其他每个方面都完全相同。更简明地说，可以归因于黑人遭 
受“种族劣势”这个事实。类似的应用也可以在假定样本中 
每个人都为印第安人的情况下实行。 

这些种族概率的估计值，分别对白人、黑人和印第安 
人这三组人，见表 3. 5上面的那部分。这部分显示如果样 
本中每个人的特征都用黑人的系数％+尽，而不是用与他 
们相关的种族系数估计， [55] 那么总样本中40%的人会在 
PMT 职业类别中，39%会在 SKL , 21 %会在 UNS 职 
业中。 

另外一种用这个方式计算种族概率的方法是，比较当 
种族变量取不同的值但其他变量都在各自情形下取样本均 
值时的概率。用$和君表示当样本中所有人都(被视为） 
是白人和样本中所有人都（被视为）是黑人时乏 s = 
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SL hx , 的均值。 [56] 

那么白人和黑人处于不同职业类别中的概率（分别用 
巧和 1，2, 3表示)是用 g 和野计算出来的， 
对第一种职业类别用方程 3. 12 a ， 对第二和第三种用方程 
3. 12 b 。 这些估计出来的概率的值，分别对白人、黑人和印 
第安人列于表 3. 5。当概率是用样本的平均特征计算时， 
估计到更大比例的白人和黑人（更小比例的印第安人）处 
于 PMT 类别 （Pf = 44. 2 %， Pf = 41.0%, P ' 3 = 

32. 6%),相对于当概率是用个人概率的均值计算时 
= 41.8 %, Pf =39.8%, P ' 3 = 33.7%)。这是因为印第安 
人具有比均值更高的高等教育文凭特征(见表3.1)，而这种 
特征对获得 PMT 职业来说是成功的主要决定因素。因此 
所有人都降低到样本均值时，印第安人会“损失”而其他人 
则“获利”。 

但是,正如表 3. 5( 样本比例）所示，只有29%的黑人男 
性雇员实际上在 PMT 职业内。黑人和白人在职业类别_;'的 
样本比例，分别用和< 表示，通常不同于种族概率，和 
f (以及 Pf 和卢。。这反映了一个情况，即黑人和白人不 
仅在他们是如何被对待的这方面不同，而且在他们的特征方 
面也不同。黑人处于 PMT 职业的样本比例 （< = 29. 3%) 
比估计到的处于该职业的种族概率(■^ = 39. 8%或者= 
41. 0%)低的情况是因为，相对于整体样本，黑人的特征更不 
适合 PMT 职业这个实际情况。或者说，黑人相对于白人，在 
PMT 职业方面会同时遇到种族和特征方面的劣势。这些劣 
势之和被称为总体劣势。 
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表 3. S 白人、黑人和印第安人处于不同职业类别的“种族”概率估计值 • 


概率估计值 



UNS 

SKL 

PMT 

个人概率估计值的均值 

白人 

17.5 

40. 7 

41. 8 

黑人 

20. 7 

39.5 

39.8 

印第安人 

19. 3 

47.0 

33. 7 

样本比例 

白人 

17. 5 

40. 7 

41.8 

黑人 

20.5 

50.2 

29.3 

印第安人 

25. 1 

39. 8 

35. 1 

用决定变量的均值计算而得的概率估计值 

白人 

14.2 

41.6 

44.2 

黑人 

19. 3 

39.7 

41. 0 

印第安人 

16.6 

50. 8 

32.6 


注： * 用表 3. 3 的多类别 logit 估计结果计算而得。 
UNS= 非技术/半技术工人。 

SKL= 有技术体力/非体力劳动者^ 

PMT = 专业/管理/技术人员。 


测量职业劣势 

黑人同白人相比，在职业类别 j 中遇到的平均的种族劣 
势的一个测量指标是<，其 中： 

A ; B = p B t / p ^ [3. 15] 

如果这两个概率相等，则 Af = 1，没有种族劣势。但是， 
如果 < < 疗，则 A ； < 1,对职业类别 j 存在黑人种族劣 
势 [57] ， Af 离1越远，则这种劣势的规模越大。 

黑人同白人相比,在职业类别 J 中遇到的平均的总体劣 
势的一个测量指标是;《；% 其中： 
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{Xj = si/sj [3. 16] 

如果这两个样本比例相等，则/ = 1，没有总体劣势。 
但是如果 < < 矿，则^ < 1 ，对职业类别7存在黑人总体劣 
势 [58] ，/离1越远，则这种劣势的规模越大。 

黑人同白人相比，在职业类别 J 中遇到的平均特征劣势 
的一个测量指标是<，其中^ i 是总体劣势与种族劣势 的比： 

矽= g / X % 

如果^ 5 = 1，则黑人没有面临特征劣势，因为/ =<。 
这种情况下，黑人与白人样本比例的比等于对应的种族概率 
的比。如果种族概率的比小于1，则完全归因于黑人与白人 
相同的特征被区别对待，对后者的评估比对前者更加有利。 
但是，如果<<1，则存在特征劣势， 而且# 离1越远这种劣 
势的规模越大。黑人在他们的特征方面受到惩罚<< <。 
他们因为具有较差的特征而吃亏，此外这些特征还（可能)更 
加不利地被评估，相比假若它们是白人的特征的话。最后， 
如果# > 1，则黑人享受了特征优势/ > A ； 0 黑人因为具有 
更好的特征而弥补了可能的不公平对待所带来的损失。其 
实，如果#的值足够大那么就可能岀现内>1，即使々<1。 
换句话说，黑人较有优势的特征可以甚于中和他们可能遇到 
的任何不公平对待。表 3. 6展示了三个不同种族的这三种 
不同的劣势估 计值。 

表 3. 6中“种族劣势”这一栏下面的数字表示，如果印第 
安人和白人配以一组共同的特征（即总样本的特征）的话，那 
么印第安人处于 PMT 类别的概率等于对应白人概率的 
81%。黑人的类似经历会产生95%这个数值。但实际上，印 
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第安人和黑人作为不同的组别，具有与总体样本不同的特 
征，这意味着印第安人和黑人在 PMT 类别的样本比例,分别 
为对应白人比例的84%和70%。印第安人从种族的81%这 
个数值上升到样本的84%这个数，以及黑人对应地从95% 
下降到70%，可能分别归因于，印第安人“具有优势的”特征 
和黑人“具有劣势的”特征。表 3. 6显示，在 PMT 职业方面， 
相对于白人，印第安人有4%的特征优势，但是黑人则有 
15 %的特征劣势。 

表 3. 6黑人和印第安人相对于白人面临的种族、特征和总体劣-的估计结果 


种族劣势特征劣势总体劣势 
(%) (.%) (%) 


用个人概率估计值的均值计算而得 

黑人/白人 




j = KSKL) 

0. 97 

1.27 

1.23 

j = 2 (PMT) 

0. 95 

0. 74 

0. 70 

印第安人/白人 




j = l(SKL) 

1.15 

0.85 

0.98 

j = 2(PMT) 

0.81 

1.04 

0.84 

用决定变量均值计算而得的概率估计值计算而得 

黑人/白人 




j = l(SKL) 

0.95 

1.26 

1.23 

j = 2 (PMT) 

0.93 

0. 75 

0. 70 

印第安人 / 白人 




j = l(SKL) 

1.22 

0.80 

0.98 

j = 2(PMT) 

0.73 

1.15 

0. 84 


注：*若取值>1，则为具有优势。用表 3. 5中的数字计算而得。 
UNS= 非技术/半技术工人。 

SKL =有技术体力/非体力劳动者。 

PMT =专业/管理/技术人员。 
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在 SKL 这个类别，印第安人相对于白人具有15%的特 
征劣势，而黑人相对于白人则有27%的特征优势。 

我们也可以把种族劣势定义为 P -/ PJ ——即通过设定 
除了种族之外的其他变量等于它们的样本均值而获得的概 
率比(见表 3. 5的下部分）。特征劣势现在重新计算为总体 
劣势 [59] 与这种新的种族劣势估计值之间的比。新的种族和 
特征劣势的值（以及没有变化的总体劣势的值)见表 3. 6。 




logit 与 probit : 次序樓型和多类别模型 


第6节 I 条件 logit 模型与不相关 
选项的独立性 


在条件 logit 模型中，结果概率 Pr ( Y , = 7+) 仅仅取决于选 
择的属性而不取决于做选择的个人的特征。或者说，条件 
logit 模型由方程 3. 3定义但附带条件疼= 0， 

= S /. W , [3. 17] 

s = l 

除此之外，这个模型与多类别 logit 模型完全一样。通常 
忽略个人特征的原因是没有个人数据。因此，条件 logit 模型 
可以有效地看做个人的集合体一此后称做“总体”——在 
具有不同属性的选项之间做选择——比如，上下班的人选择 
不同的交通方式或者消费者选择不同的超级市场。通过这 
种想法，与个人相关的下标；就可以在下面的讲解中去掉了。 
因变量 y = ) 与总体所做的选择相关，系数 x 指总体附于第 
s 个属性的权重。与在多类别模型中一样，在条件 logit 模型 
中任意两个选项 J 和6的风险比独立于其他可供选择的 
选项， 

log ( pr ( y |= f )) = 4 —乙=_ (% - W fe ) y s [3.18] 
在方程 3. 18中，风险比对数仅仅取决于与 和々 相关的 
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属性(间的差别），与其他选项的属性无关。 [6<)] 这个特性称为 
不相关选项的独立性 ( I / A ), 既是这些模型的主要优点，也是 
它们的主要缺点。 [61] 它是优点因为它允许在不需要重新估 
计模型的情况下引进新的选项。 

比如，假设引进了第 （ M +1) 个选项，其属性为 W M+1 , iS 
=1，…， S 。 与这个新选项相关的估计到的 Z 值 （ Z - value ) 
为： Z M+1 = 9 s W m + Us , 其中系数估计值 L 已经有 

了。新选项的采用所需要的只是，在方程 3. 3的分子中加入 
一个新的项 f M +1 并对概率重新计算。已有的系数估计值能 
同时在选项扩充之后使用的原因在于，新选项的加人并不能 
改变已有的选项被选择时的相对风险。 

假定加入了某个新选项，选择特定选项的概率其变化的 
百分比可以很容易计 算为： 


= 一 exp(Z M +i) 

^^'expCZj) 

=— Pr (广 = M +1) 

其中， Pr ( Y M+1 =_/)和？1<¥ 1 ^=_/')分别指当有]^+1个 
和 M 个可供选择的选项时，选择选项 j 的概率。因此引进一 
个额外的选项时，选择已有的不同选项的概率将会减少相同 
的百分比，这个百分比等于选择这个新选项的概率。 

但是，这个在引进新选项时已有概率下降相同百分比的 
特性同时也是一个缺点，因为它意味着对已有选项，关于新 



p r (Y^i = /) 一 

PrO^: 


( exp(Z,) S 


: exp(Z,) ex P( Z )) 
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选项的需求的交叉弹性在不同的选项间是一致的。 [62] 要使 
这个有效，这些选项必须被看做完全不同且独立的。它们被 
如此看待并导致 1 IA 这个实际情况，源于误差是独立同分布 
这个假设。 

该模型的局限性有多大的负面影响取决于所分析问题 
的本质。比如，在职业选择的模型中，选项可能被视为定义 
明确且相对不可改变，引进新选项带来的问题可能并不严 
重。 [63] 但另一方面，在选择上下班交通方式这个例子中，必 
须考虑到新的交通方式的引进一新的火车路线、公共汽车 
路线、小车交通拥挤费，等等——极有可能带来严重的问题。 

一个典型的由 IIA 假设引起的问题的例子是“红巴士一 
蓝巴士”问题。假设上下班者有三种选择 :乘坐 小汽车、火车 
或者巴士去上班。顺便地假设所有的巴士都漆成红色，并且 
Pr(Y = j ) 的 logit 估计 值为： 

小汽车: 55. 4 
巴士(红色 ）：23. 0 
火车:21.6 

小汽车和巴士这两个交通方式间的风险比为 55. 4/23. 0 
= 2. 4。现在巴士公司决定把一半的车漆成蓝色，我们可以 
很合理地预期这个纯粹表面的改变并不会给通勤者的选择 
带来任何变化，并且相同百分比的人，如上所示，将会继续使 
用小汽车、巴士和火车上班。但是，由于模型不能识别虚假 
的和真实的新选项，在引进“第四种”选项后预测到的 logit 概 
率变成 [64] : 

小汽车: 45. 1 
巴士(红色 ）：18. 8 
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巴士(蓝色 ）：18. 4 

火车：17.7 

注意，每个已有选项小汽车、（红色）巴士和火车的概率 
都下降了 18. 4%,即使用蓝巴士上班的概率。使用小汽车和 
红色巴士（以及使用火车和红色巴士）之间的风险比保持不 
变，但是为了迁就这个情况，一些之前使用小汽车、火车或者 
红色巴士的通勤者必须改变以乘坐蓝色巴士上班。因此，仅 
仅由于把一半的车改漆成蓝色，巴士公司就可以使所有通勤 
者中乘坐巴士上班的比例由23%增加到 37. 2%。 

另一个更明显的例子可以从政界中找到。假设某个政 
党 X 与其他两个政党 Y 和 Z 竞争。用多类别 logit 模型我们 
可以用相对于投 X 政党票的概率的一个比值，来估计支持 Z 
的投票者的概率。假设现在政党 X 分成两个党， XI 和 X 2, 
它们具有类似的（比如左派的）观点，且笼统地被投票者认为 
两者间并没有本质差别。但是，由于模型不能识别虚假的和 
真实的新选项，在引进“第四种”政党后，预测到的投左派政 
党的票的 logit 概率将会大幅上升。这就是条件 logit 的一大 
缺 陷：在 IIA 假设下，模型无法解决由引进类似的或相同的 
选项所带来的虚假的比例膨胀问题。 

顺便提一下，我们应该注意由混合选择所带来的更进一 
步的局限性一比如，对上班时间和交通模式两者同时进行 
的选择。那么，正如多门西克和麦克法登 (Domencich & Me 
Fadden , 1996) 指出的，选择时间 f 和模式的联合概率 PrQ 
(1 J )， 可以写成(在时间 G 从可供利用的选择模式中，选择模 
式 J 的概率)和（从可供利用的时间选项中选择时间《的概 
率）的联合结果。换句话说， IIA 的一个含义是，包含混合选 
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择的效用函数必须是可以从个人选择中加法可分的， u ( t ， 
j ) = ^(>) +0 U )。 

条件 logit 模型的替代模型 


在考虑条件 logit 模型的替代方法之前，重要的是先检查 
IIA 假设是否有效。假设我们相信选择的某个子集是不相关 
的。把它从选择集中去掉应该不会显著改变系数估计值。 
这个想法是豪斯曼和麦克法登 （Hausman &■ McFadden , 
1984) 检验的依据。如果 h 是基于受了限制的选择项而得 
到的系数估计值的向量，而 h 是基于完整选项而得出的系 
数估计值的向量，且 - Vo 是它们协方差矩阵的各自的估 
计值，那么统计值 （—Ax — 在 IIA 
的限制是有效的这个零假设下，服从 z 2 ( S ) 分布。 

如果这个零假设不被接受，那么一种可选择的方法是把 
方程 3. 1中的随机效用函数确定为多变量 probit 模型， I /,= 

2/^+ e , ~ N (0, 2) 0 其中，因为具有一个非纯量协 

5 = 1 

方差矩阵2,误差项就不再需要是独立的了。这个模型的问 
题是对多重正态积分和非限制协方差矩阵的估计进行计算 
这个实践问题 ( Greene , 2000:865)。 

另一个放宽 IIA 限制的方法是对可供选择的选项进行 
分组，以使方差在组间不同，但在组内相同。这样就可以在 
选项组间放宽 IIA 假设，但是在每一组内仍然保留。这就是 
嵌套 logit 方法。这个问题不在这里讨论，详情及其应用请参 
考格林 (1995) 的论述。 
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第1节 I 简介 


本章列出了产生前文所讨论的结果的 STATA 程序清 
单。在概论部分作者已经讲过——但值得重复——至少有 
四种众所周知的具高度好评的软件，除了其他方面，还解决 
与本书所讨论的类似的 问题: SAS，SPSS vlO . 0( 印第安纳大 
学统计与数学计算中心为在次序与非次序结果事件的分析 
中应用 SAS 和 SPSS 提供了很好的入门课程 [65] ) ， LIMDEP 
( Greene , 1995) ，以及 STATA ( STATA ， 1999)。碰巧作者 
对 STATA 最熟悉，因此，这一章中的程序均用 STATA 
编写。 

下一部分包含了在第2章次序 logit 和 probit 模型中用 
到的程序清单，随后也包含了在第3章多类别 logit 模型中用 
到的程序清单。这些程序与相应的注释一起列出。这些注 
释的目的有 三个： 

(1) 解释特定的程序编码用来做什么(或做了什 么）； 

(2) 把该编码与前面内容涉及的某个特定的表格联系起 
来，以使读者看到那些结果是如何产 生的； 

(3) 把该编码与前面内容涉及的某些特定的方程联系起 
来，以使读者看到用以产生某个特定结果的方法。 
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第2节 I 次序 probit 和 logit 程序 


version 6. 0 / * 使用 STATA 版本 6. 0 * / ； 
use C ：\ SAGE\NLdta / * 读取 STATA 格式的数据 ： 58 
个变量，13164个观察值 */; 

井 delimit ; /* 命令 将由; 终止 */; 

/ * 题目：使用剥夺分析例子的次序 logit 和 probit */； 
gen pnum = _ N ; / * 对每个人分配一个数字 * /; 

/ * 对次序 logit，y 是因 变量; y = 1为没有被剥夺 ;y = 
2为轻度被 剥夺 ； y = 3为严重被剥夺* /; 
tabulate y rc ， col ； tabulate y sex , col ； 

卜 用整个次样本估计 Oprobit 方 程:表 2. 2 * /; 
oprobit y sex ct age age 2 ret inac ue highed mided hnum 
snpar ard dwn crk ant col arm ban dry £ rm , table ； 

predict pi p 2 p 3； / * 估计到的概率储存为 pi , p 2, 
p 3 * / ; 

sort pnum ； /* 观察值用个人的数字以升序的形式分 
类 W ; 

list pnum pi p 2 p 3 in 1/25， noobs ; / * 用个人数字列出 
前 25 个人的估计到的概 率:表 2. 4 * / ; 

summarize pi p 2 p 3, detail ； / * 详细概括估计到的个人 
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概 率:表 2.6 */; 

predict z , xb ； / * 对每个人计算2值 * /; 

summarize z , mean ； gen zm = r ( mean ) ； / * 计算 Z 的 
均值并存于 zm 这个变量中 * /; 

/ * b [_ cutl ] and b [_ cut 2] 储存了 临界值 & 和 S 2 的估 
计值 * /; 

gen pi — normprob (— b [_ cutl ] — z ) ； gen p 2 = normprob 
(_ b [_ cut 2] — z ) — normprob (_ b [_ cutl ] — z ) ； gen p 3 = 1 - 
normprob (一 b [_ cut 2] — z )； 

h 对每个人 pi ， p 2 和 p 3 为用方程 2. 5 a 至 2. 5 c 计算 
出来的概率的估计值，这些值与之前计算出来的 pi — p 3 的 
估计值相同，上面 */; 

gen ql = normprob (_ b [一 cutl ] — zm ) ； gen q 2 = normprob 
(_ b [一 cut 2] — zm ) — normprob (_ bf cutl ] — zm ) ； gen q 3 = 1 — 
normprob (_ b [_ cut 2] — zm )； 

/ * ql ， q 2 和 q 3 是在设定取值等于样本均值的情况下 
计算出来的概率估计值 :方程 2.18 a 至 2.18 c */; 

summarize pi p 2 p 3； summarize ql q 2 q 3； / * 比较概 
率:表 2.8 */; 

drop pi p 2 p 3 ql q 2 q 3; / * 因为随后还要用到，在此放 
弃这些变量名 * / 

/ * 计算边际效 应:连 续变量 ( Age ) * / ; 

gen al — normd (一 b [一 cutl ] — z ) * _ b [ age ]; 

gen a 2 = ( normd (一 b [一 cut 2] — z ) — normd (一 b [一 cutl ] — 
z ) *_ b [ age ]； 

gen a 3 = — 1 * normd (一 b [一 cut 2] — z ) * _ b [ age ]; 
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/* al _ a 3 是对每个人计算的 AGEi 的边际效应 :方程 
2. 13 a 至 2.13 c * /; 

gen ami = normd (_ b [_ cutl ] - zm ) * _ b [ age ]； gen 
am 2 — ( normd(_b [_ cut 2] - zm ) — normd (_ b [_ cutl ] — 
zm )) *_ b [ age ]; 

gen am 3 =— 1 * normd (_ b [_ cut 23 一 zm ) * _ bCage ]； 

/* ami — am 3 是设定变量值等于样本均值时 AGE 的 
边际效应 * /; 

gen bl = normd (_ b [_ cutl ] — z ) * _ b [ age 2]； 

gen b 2 = ( normd (_ b [_ cut 2] — z ) — normd (_ b [_ cutl ] — 
z )) * _ b [ age 2]； 

gen b 3 = — 1 * normd (_ b [_ cut 2] — z ) * — b [ age 2]; 

卜 bl — 是对每个人计算的 AGEf 的边际效应 :方程 

2. 13 a 至 2. 13 c */; 

gen bml = normcK 一 b [一 cutl ] — zm ) * 一 b [ age 2]; 

gen bm 2 = ( normd (_ b [_ cut 2] - zm ) - normd (_ b [_ 
cutl ] — zm )) *_ b [ age 2]; 

gen bm 3 = — 1 * normd (一 b [一 cut 2] — zm ) * 一 b [ age 2]; 

卜 bml - bm 3® 是设定变量值等于样本均值时 AGE 2 
的边际效应*八 

gen cl = al + bl ; gen c 2 — a 2 + b 2 ； gen c 3 = a 3 + b 3; 
gen cml = ami + bml ； gen cm 2 = am 2 + bm 2； gen cm 3 = 
am 3 + bm 3； 

/* 加上 AGE 和 AGE 2 的作用 */; 


① 原文中为 al — a 3, 其实有误。——译者注 

② 原文中为 ami — am 3, 其实有误。——译者注 
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summarize cl c 2 c 3； summarize cml cm 2 cm 3； / * 表 

2.10 */； 

drop z zm cl al bl c 2 a 2 b 2 c 3 a 3 b 3 cml ami bml cm 2 
am 2 bm 2 cm 3 am 3 bm 3； 


/ * 计算边际效应:虚拟变量 ( Religion ) * / ; 
gen cto = ct ； / * 保存原值 * /; 
replace ct = 1; / * 每个人都是天主教徒 * /; 
predict pi p 2 p 3; / * 当 CTi = 1对每个人估计概率 * / ; 
predict z , xb ； summarize z ； gen zm = r ( mean ); / * 计 
算 Z 的均值并存于 zm 这个变量中 * / ; 

gen ql = normprob(_b [ 一 cutl] — zm) ； gen q2 = norm- 
prob(_b[_cut2] - zm) — normprob(-b [ 一 cutl] — zm) ； gen q3 
=1 — normprob(_b [一 cut2] — zm )； 

/*ql ， q2 和 q3 是在设定非宗教取值等于样本均值的 
情况下计算出来的概率估计值 * /; 

summarize pi p2 p3 ； summarize ql q2 q3 ； / * 表 
2.12 */; 

drop pi p 2 p 3 ql q 2 q 3 z zm ； 
replace ct = 0; / * 每个人都是新教徒 * /; 
predict pi p 2 P 3; / * 当 CTi = 0 对每个人估计概率 * / ; 
predict z , xb ； summarize z ； gen zm = r ( mean ) ; / * 计 
算 Z 的均值并存于 zm 这个变量中 * / ; 

gen ql — normprob(_b[_cutl J — an) ； gen q2 = normprob 
(Jb[—cut2] — zm) — normprob(_bC_cutl ] — zm) ； gen q3 = 1 — 
normprob(_b[_cut2] — zm )； 
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卜 ql ， q 2 和 q 3 是在设定非宗教取值等于样本均值的 
情况下计算出来的概率估计值 * / ; 

summarize pi p 2 p 3； summarize ql q 2 q 3； /* 表 

2 . 12 */ ; 

drop pi p 2 p 3 ql q 2 q 3 z zm ； replace ct = cto ; / * 恢复 
原值关 /; 

/* 用整个次样本估计 Oprobit 方 程:表 2.1 */; 
ologit y sex ct age age 2 ret inac ue highed mided hnum 
snpar ard dwn crk ant col arm ban dry frm , table ； 

predict pi p 2 p 3; / * 估计到的概率储存为 pi ， p 2, 
p 3*/; 

sort pnum ； /* 观察值用个人的数字以升序的形式分 
类"； 

list pnum pi p 2 p 3 in 1/25， noobs ； / * 用个人数字列岀 
前25个人的估计到的概 率:表 2.4*/； 

summarize pi p 2 p 3, detail ； / 关详细 概括估计到的个人 
概 率:表 2. 6*/; 

predict z , xb ； / * 对每个人计算冗值 * / ; 
summarize z , mean ； gen zm = r ( mean ) ； / * 计算 Z 的 
均值并存于 zm 这个变量中 * / ; 

/ * b [_ cutl ] 和 b [_ cut 2] 储存了临界值在和 S 2 的估计 
值*/; 

gen pi = l/(l + e 符 >(z —_ b [一 cutl ])); gen p 2 = 1/(1 + 
exp ( z—„b C _ cut 2])) — 1/(1 + exp ( z —_ b [_ cutl ])>； genp 3 = 
1 — 1/(1 + exp ( z — _b C _ cut 2]))； 

卜 对每个人 pi ， p 2 和 p 3 为用方程 2. 5 a 至 2. 5 c 计算 
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出来的概率的估计值，这些值与之前计算出来的 pi — p 3 的 
估计值相同，上面 

gen ql = 1/(1 + e ^ Czm —_ bLcutl ])) ； gen q 2 = 1/(1 + 
exp ( zm — _b [一 cut 2])) — 1/(1 + exp(zm — _b [_ cutl ])); gen 
q 3 = 1 — 1/(1 + exp(zm —_b [_ cut 2])); 

卜 ql ， q 2 和 q 3 是在设定取值等于样本均值的情况下 
计算出来的概率估计值 :方程 2. 18 a 至 2. 18 c * /;. 

summarize pi p 2 p 3 ； summarize ql q 2 q 3； / * 比较概 
率:表 2.7 */; 

drop pi p 2 p 3 ql q 2 q 3； / * 因为随后还要用到，在此放 
弃这些变量名 */; 

/ * 计 算边际 效应: 连续变量 (Age) * /; 
gen ldenl = 1/ (1 + exp(z — _b[_cutl])); 
gen lden2 = 1/(1 + exp(z — —b[_cut2])); 
gen lden3 — 1/(1 + exp(z — _b [ 一 cut2])); 
/*1 呢卜概率计算出来了 ： 方程 2.93 至 2.9(^/; 
gen al = ldenl * (1 — ldenl) * _b[age]; gen bl = ldenl 
* (1 — ldenl) * _b[age2 ]； gen cl = al +bl; gen a2 = 
(lden2 * (1 — lden2) — ldenl * 

(1 — ldenl )) * _ b [ age ]; 

gen b 2 = ( lden 2 * (1 - lden 2) — ldenl * (1 — ldenl )) * 
_ b [ age 2]； 

gen c 2 = a 2+ b 2； 

gen a 3 — - lden 3 * (1 - lden 3) * — b [ age ]; 
gen b 3 = _ lden 3 * (1 _ lden 3) * _ b [ age 2]; 
gen c 3 = a 3 + b 3 ； 
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原为 al — a 3, 其实有误。 一 ~译者注 
原为 bl — b 3, 其实有误。——译者注 
原为 cl — c 3, 其实有误。——译者注 


/* al — a 3 是对每个人计算的 AGEi 的边际效应 :方程 
2. 12 a 至 2.12 c * /; 

/ * bl — b 3 是对每个人计算的 AGEf 的边际效应 :方程 
2. 12 a 至 2. 12 c */； 

/ * cl — c 3 是这些效应的和 * /; 
replace ldenl = 1/(1 + exp(zm —_ b [_ cutl ])) ; 
replace lden 2 = 1/(1 + exp(zm — _ b [_ cut 2])); 
replace lden 3 = 1/(1 + exp(zm — — b [一 cut 2])); 

卜 logit 概率用均值计算*/ ; 
gen ami = ldenl * (1 — ldenl ) * _ b [ age ]; 
gen bml = ldenl * (1 一 ldenl ) * _ b [ age 2]； 
gen cml ― ami + bml ； 

gen am 2 = ( lden 2 * (1 — lden 2) — ldenl * (1 — ldenl )) 

* _ b [ age ]； 

gen bm 2 = ( lden 2 * (1 — lden 2) — ldenl * (1 — ldenl )) 

* _ b [ age 2]； 

gen cm 2 = am 2 + bm 2； 
gen am 3 = — lden 3 * (1 — lden 3) * 一 b [ age ]; 
gen bm 3 = — lden 3 * (1 — lden 3) * _ b [ age 2]； 
gen cm 3 = am 3 + bm 3 ； 

/ * ami - am 3$ 是用样本均值计算的 AGEi 的边际效应 
*/;/* bml — bm 3® 是用样本均值计算的 AGE 的边际效 
应 * /; / * cml — cm 3® 是这些效应的和 * /; 


①②③ 
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summarize cl c 2 c 3； summarize cml cm 2 cm 3； / * 
表 2.9 */; 

drop z zm cl al bl c 2 a 2 b 2 c 3 a 3 b 3 cml ami bml cm 2 
am 2 bm 2 cm 3 am 3 bm 3； 

replace ct = 1; / * 每个人是天主教徒 * / ; 
predict pi p 2 p 3; / * 当 CTi = 1 对每个人估计概率 * / ; 
predict z ， xb ; summarize z ； gen zm = r ( mean ); / * 计算 Z 
的均值并存于 zm 这个变量中 */; 

gen ql = 1/(1 + exp ( zm —一 b [一 cutl ])); gen q 2 = 1/(1 + 
exp ( zm — _b [_ cut 2])) — 1/(1 + exp ( zm - — b [— cutl ])) ； gen 
q 3 = 1 — 1 /(l + exp(zm — _b [_ cut 2])); 

/* ql ， q 2 和 q 3 是在设定非宗教取值等于样本均值的 
情况下计算出来的概率估计值 * /; 

summarize pi p 2 p 3； summarize ql q 2 q 3； /* 表 
2.11 */; 

drop pi p 2 p 3 ql q 2 q 3 z zm ； 
replace ct = 0; / * 每个人都是新教徒 * /; 
predict pi p 2 p 3 ; / * 当 CTi = 0 对每个人估计概率 * / ; 
predict z xb ； summarize z ； gen zm = r ( mean ) ； / * 计算 
Z 的均值并存于 zm 这个变量中 * / ; 

gen ql = 1/(1 + exp ( zm —_ b [_ cutl ])) ； gen q 2 = 1/(1 + 
expizm—_b [_ cut 2])) — 1/(1 + exp(zm —— b [一 cutl ])) ; gen 
q 3 = 1 — 1/(1 + exp(zm — _ b [_ cut 2])); 

/* ql ， q 2 和 q 3 是在设定非宗教取值等于样本均值的 
情况下计算出来的概率估计值 * /; 

summarize pi p 2 p 3； summarize ql q 2 q 3； /* 表 
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2.11 */； 

drop pi p 2 p 3 ql q 2 q 3 z zm ； 
replace ct = cto ； / * 恢复原值 * /; 

/ * 用新教徒次样本估计 Oprobit 方程 * /; 
ologit y sex age age 2 ret inac ue highed mided hnum 
snpar ard dwn crk ant col arm ban dry frm if ct = 0， table ； 
lrtest ? saving (0) ; / * 为 LR 检验储存概率值 * / ; 
ologit y sex age age 2 ret inac ue highed mided hnum 
snpar ard crk ant col arm ban frm if ct = 0， table ； 

lrtest ； / * LR 检验 dwn 和 dry 的系数联合等于 0 * /; 
/* 对新教徒用新教徒的系数进行预测，且计算均 
值"； 

predict ppal ppa 2 ppa 3 if ct = 0; egen mppal = mean 
( ppal ) ； egen mppa 2 — mean ( ppa 2) ； egen mppa 3 = mean 
( ppa 3)； 

predict ppsl pps 2 pps 3 if ct = 0 &- snpar = 1 ； 
egen mppsl — mean ( ppsl ); egen mpps 2 = mean ( pps 2)； 
egen rr ^) ps 3 = mean ( pps 3) ； predict pprl ppr 2 ppr 3 if ct = 0 &- 
ret = 1 ； egen mpprl = mean ( pprl ) ； egen mppr 2 = mean 
( ppr 2) ； egen mppr 3 = mean ( ppr 3)； 

predict ppil ppi 2 ppi 3 if ct = 0 &- inac — 1 ； 
egen mppil = mean ( ppil ) ； egen mppi 2 = mean ( ppi 2)； 
egen mppi 3 = mean ( ppi 3) ； predict ppul ppu 2 ppu 3 if ct = 0 
&. ue = 1 ； egen mppul = mean ( ppul ) ； egen mppu 2 = mean 
( ppu 2)； egen 


mppu 3 = mean ( ppu 3)； 
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predict ppll ppl 2 ppl 3 if ct = 0 & resnum — 1 ； 
egen mppll = mean ( ppll ) ； egen mppl 2 = mean ( ppl 2)； 
egen mppl 3 = mean ( ppl 3)； 

/ * 用天主教徒次样本估计 Oprobit 方程 * / ; 
ologit y sex age age 2 ret inac ue highed mided hnum 
snpar ard dwn crk ant col arm ban dry frm if ct = 1 ， table ； 
lrtest , saving ( O ); / * 为 LR 检验储存概率值 * / ; 
ologit y sex age age 2 ret inac ue highed mided hnum 
snpar ard crk ant col arm ban frm if ct = 1 ， table ； lrtest ； / * 
LR 检验 dwn 和 dry 的系数联合等于 0 * 

/* 对天主教徒用天主教徒的系数进行预测，且计算均 
值"； 

predict ccal cca 2 cca 3 if ct = 1 ； 

egen mccal = mean ( ccal ) ; egen mcca 2 = mean ( cca 2)； 
egen mcca 3 = mean ( cca 3) ； predict ccsl ccs 2 ccs 3 if ct = 1 & 
snpar = 1; egen mccsl = mean ( ccsl ); egen mccs 2 = mean 
( ccs 2) ； egen mccs 3 = mean ( ccs 3)； 

predict ccrl ccr 2 ccr 3 if ct = 1 ret = 1 ； 
egen mccrl = mean ( ccrl ) ； egen mccr 2 = mean ( ccr 2)； 
egen mccr 3 = mean ( ccr 3) ； predict ceil cci 2 cci 3 if ct — 1 &• 
inac = 1 ； egen mccil = mean ( ceil ) ； egen mcci 2 = mean 
( cci 2) ； egen mcci 3 = mean ( cci 3)； 

predict ccul ccu 2 ccu 3 if ct = 1 & ue = 1 ； 
egen mccul = mean ( ccul ) ； egen mccu 2 = mean ( ccu 2)； 
egen mccu 3 = mean ( ccu 3)； 

predict cell ce !2 cel 3 if ct = 1 &- resnum = 1 ； 
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egen mcell = mean (cell) ； egen mcel2 = mean(cel2 )； 
egen mcel3 = mean(cel3 )； 

/* 对新教徒用天主教徒的系数进行预测，且计算均 

predict peal pca2 pca3 if ct = 0 ； 

egen mpeal = mean(pcal) ； egen mpca2 = mean(pca2) ? 
egen mpca3 = mean(pca3 )； 

predict pcsl pcs2 pcs3 if ct = 0 &- snpar = 1 ； 
egen mpcsl — mean(pcsl) ； egen mpcs2 = mean(pcs2 )； 
egen mpcs3 = mean(pcs3 )； 

predict perl pcr2 pcr3 if ct = 0 ret — 1 ； 
egen mpcrl = mean(pcrl) ； egen mpcr2 = mean(pcr2 )； 
egen mpcr3 — mean(pcr3 )； 

predict pcil pci2 pci3 if ct = 0 &- inac = 1 ； 
egen mpcil = mean (pcil) ； egen mpci2 = mean(pci2 )； 
egen mpci3 = mean(pci3 )； 

predict pcul pcu2 pcu3 if ct = 0 & ue = 1; 
egen mpcul = mean ( pcul ) ； egen mpcu2 — mean 
(pcu2) ; egen mpcu3 = mean(pcu3 )； 

predict pcil pcl2 pcl3 if ct = 0 & resnum = 1 ； 
egen mpcil = mean (pcil) ； egen mpcl2 = mean(pcl2 )； 
egen mpcl3 = mean(pcl3 )； 

/ * 现在百分比贡献 (percentage contributions) 可以计算 
出来了 */; 

gen Aal = [ (mppal — mpeal)/( mppal — mccal)] 
* 100； 
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gen Aa2 = [( mppa2 — mpca2 )/( mppa2 — mcca2 )] 
* 100； 

gen Aa3 = [(mppa3 — mpca3 ) / ( mppa3 - mcca3)] 
* 100； 

gen Asl — [( mppsl — mpcsl )/( mppsl — mccsl )] 
* 100； 

gen As2 — [ (mpps2 — mpcs2 ) / ( mpps2 — mccs2)] 
* 100； 

gen As3 = [( mpps3 — mpcs3 ) / ( mpps3 — mccs3)] 
* 100； 

gen Arl = [(mpprl — mpcrl)/(mpprl — mccrl)] * 100 
gen Ar2 = [(mppr2 — mpcr2 ) / (mppr2 — mccr2)] 
* 100； 

gen Ar3 = [(mppr3 — mpcr3 ) / ( mppr3 — mccr3 )] 
* 100； 

gen Ail = [(mppil — mpcil)/(mppil — mceil)] * 100 ； 
gen Ai2 — [(mppi2 — mpci2) / (mppi2 — mcci2)] * 100 ； 
gen Ai3 = [(mppi3 — mpci3)/(mppi3 — mcci3)] * 100; 
gen Aul = [(mppul — mpcul)/( mppul — mccul)] 
* 100 ； 

gen Au2 = [(mppu2 — mpcu2)/(mppu2 — mccu2)] 
* 100； 

gen Au3 — [(mppu3 — mpcu3 )/( mppu3 — mccu3 )] 
* 100； 

gen All = [(mppil — mpell)/(mppil — mceil)] * 100 ； 
gen A12 = [(mppl2 — mpel2) / (mppl2 — mcel2)] * 100 ； 
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gen A13 = [(mppl3 — mpel3)/(mppl3 — mcel3)] * 100 ； 
summarize 

ppal ppa2 ppa3 peal pca2 pca3 ccal cca2 cca3 ppsl pps2 
pps3 pcsl pcs2 pcs3 ccsl ccs2 ccs3 pprl ppr2 ppr3 perl pcr2 
pcr3 ccrl ccr2 ccr3 ppil ppi2 ppi3 pcil pci2 pci3 ceil cci2 cci3 
ppul ppu2 ppu3 pcul pcu2 pcu3 ccul ccu2 ccu3 ppll ppl2 ppl3 
pell pcl2 pcl3 cell ccl2 ccl3 ； 

" 表 2.16 

summarize Aal Aa2 Aa3 Asl As2 As3 Arl Ar2 Ar3 Ail 
Ai2 Ai3 Aul Au2 Au3 All A12 A13; / * 表 2. 17 */； 

/* 程序结束 */ ; 
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第3节 | 多类别 logit 程序 


use c:\SAGE\GB. dta / * 读取 STATA 格式的数据 : 24 
个变量， 98732 个观察 值 : 这 些数据为白人、黑人和印第安人 
全职男性雇员， 25—45 岁 */; 

# delimit ； 

/ * 题目 ：使用 职业类别分析例子的多类别 logit */； 
gen pnum = _N ； / * 对每个人分配一个数字 * / ; 

/* 多类别 10 也中 7 是因变量，且 
y= 1 如果这个人受雇于非技术/半技术工人职业类别 
y = 2 如果这个人受雇于有技术体力/非体力劳动者职 
业类别 

y = 3 如果这个人受雇于专业 / 管理/技术人员职业类 
别"； 

/ * 对所有人、白人、黑人、印第安人列表 * / ; 
tab y ； tab y if blk = 0 &-ind = 0 ； tab y if blk = 1 ； tab y 
if ind = 1; 

/* 现在估计多类别 logit 方程，表 3. 2 :模型设定见方程 
3.14 。注 ：以下 based) 设结果 1 为基准值 */ ; 

mlogit y age age2 blk blkovs ind indovs ovsbn 
north indnth 
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blknth south indsth blksth highed indhe blkhe mided 
indme blkme subbus subsei bush scih ， based); 
lrtest, saving(O) ; / * 为 LR 检验储存似然对数 * /; 

/ * 确定零限制 : 对 y = 2 ， blk 和 blkovs 从方程中去掉 ; 
对乂 = 3 ， ind ， blknth, scih, bush, subsei 从方程中去掉； in¬ 
dme ， indhe, blkme 在两个方程中都去掉 * /; 

constraint define 1 [2] blkovs = 0 ； constraint define 2 
[3]blk = 0; 

constraint define 3 [3jind = 0 ； constraint define 4 [3] 
blknth — 0 ； 

constraint define 5 [3]scih = 0; constraint define 6 [3] 
bush = 0 ； 

constraint define 7 [3] subsei = 0 ； constraint define 8 in¬ 
dhe ； 

constraint define 9 indme ； constraint define 10 blkme ； 

/ * 现在在强加限制 1-10 的情况下估计 mlogit 方程， 
表 3. 3 。 注 : 下面的 constr(l — 10) 为强加限制的命令 * /; 
mlc^it y age age2 blk blkovsind indovs ovsbn north indnth 
blknth south indsth blksth highed indhe blkhe mided in¬ 
dme 

blkme subbus subsei bush scih, constr(l—10) base(l )； 
lrtest ； / * ' 似然比检验 完成 : chi2(13) = 8. 1 零限制没有 
被拒绝 。 */; 

/* 对每个人对结果 1 ， 2, 3 估计到的概率分别储存为 
pi, p2, p3 * /； 

predict pi, outcome(1) ; predict p2, outcome(2) ； pre- 
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diet p3, outcome(3 )； 

/ * 对所有人，白人，黑人和印第安人，概括概率估计值 
( 表 3.4 上部分 ）*/ ; 

summarize pi p2 p3 ； summarize pi p2 p3 if blk. = 0 & 
ind = 0; summarize pi p2 p3 if blk = 1 ； summarize pi p2 p3 
if ind = 1 ； 

drop pi p2 p3; / * 因为随后还要用到，在此放弃这些变 
量名 */; 

/* 对每个人对结果 1 ， 2, 3 计算 Z 值，并储存为 zl ， 
z3 * /; 

predict zl ， outcome(l) xb ； predict z2 ， outcome(2) xb ； 
predict z3 ， outcome(3) xb; 

/ * zl ， z2, z3 的均值储存为 zml, zm2 ， zm3 * / ； 

summarize zl ， mean ； gen zml = r(mean )； summarize 
z2, mean ； 

gen zm2 = r(mean) ； summarize z3, mean ； gen zm3 = r 
(mean )； 

/* 对所有人，用方程 3. 12a 和 3. 12b 计算结果 1 ， 2, 3 

的概率 */; 

gen sum = 1 + exp(zm2) +exp(zm3) ； gen pi — 1/sum ； 

gen p2 — exp (zm2)/sum ； gen p3 = exp(zm3)/sum ； 
summarize pi p2 p3 ； / * 对所有人展示了概率估计值 ( 表 3. 4 
下部分 ）*/; 

drop sum pi p2 p3 zml zm2 zm3 ； / * 因为随后还要用 
到，在此放弃这些变量名 */ ; 

/* 现在对白人计算 zl z2 z3 的均值，并储存于 zml ， 
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zm2, zm3 * /; 

summarize zl if blk = 0 & ind = 0 ， mean ； gen zml = r 
(mean) ； summarize z2 if blk — 0 &- ind = 0 ， mean ； gen zm2 = 
r(mean )； summarize z3 if blk = 0 ind = 0 ， mean ； gen 
zm.3 — r(mean )； 

/ * 对白人，用方程 3. 12a 和方程 3. 12b 计算结果 1 ， 2, 
3 的概率 */; 

gen sum = l + exp(zm2) + exp(zm3); gen pi = 1/sum ； 
gen p2 = exp(zm2)/sum ； gen p3 = exp(zm3)/sum; summa¬ 
rize pi p2 p3 if blk — 0 &-ind = 0 ； 

/ * 对白人展示了概率估计值 ( 表 3. 4 下部分 ）* /; 
drop sum pi p2 p3 zml zm2 zm3 ； / * 因为随后还要用 
到，在此放弃这些变量名 */ ; 

/* 现在对黑人计算 Z 1 z2 z3 的均值，并储存于 zml, 
zm2, zm3 * /； 

summarize zl if blk = 1, mean ； gen zml = r(mean )； 
summarize z2 if blk = 1 ， mean ； gen zm2 = r(mean )； 
summarize z3 if blk = 1, mean ； gen zm3 = r(mean )； 

/ * 对黑人，用方程 3. 12a 和方程 3. 12b 计算结果 1 ， 2, 
3 的概率 

gen sum = 1 + exp(zm2) +exp(zm3) ； gen pi = 1/sum ； 
gen p2 = exp(zm2)/sum ； gen p3 = exp(zm3)/sum ； 

summarize pi p2 p3 if blk = 1; / * 对黑人展示了 概率估 
计值 ( 表 3.4 下部分 ）*/ ; 

drop sum pi p2 p3 zml zm2 zm3 ； / * Variables are re¬ 
leased for subsequent use * / ； 
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/* 现在对印第安人计算 Zl Z 2 z3 的均值，并储存于 
zml ， zm2 ， zm3 * / ； 

summarize zl if ind = 1 ， mean ； gen zml = r(mean )； 
summarize z2 if ind = 1 ， mean ； gen zm2 = r(mean )； 
summarize z3 ifind = 1 ， mean ； gen zm3 = r(mean )； 

/ * 对印第安人，用方程 3. 12a 和方程 3. 12b 计算结果 
1 ， 2, 3 的概率 */; 

gen sum = 1 + exp(zm2) + exp(zm3) ； gen pi = 1/ 
sum ； gen p2 = exp(zm2)/sum ； gen p3 — exp(zm3)/sum ； 
summarize pi p2 p3 if ind == 1 ； / * 对印第安人展示了概 
率估计值 ( 表 3.4 下部分 ）*/ ; 

drop sum pi p2 p3 zml zm2 zm3 ； drop zl z2 z3 ； / * 因 
为随后还要用到，在此放弃这些变量名 * /; 

/* 接着为种族模拟分析 * /; 

gen blko — blk ； gen indo = ind ； / * 保存种族变量 * / ; 
replace blk = 0 ； replace ind = 0 ； / * 每个人都是白人 * /; 
卜 所有涉及 blk 和 ind 的交互变量都需要重新计算 * /; 
replace indnth = ind * north ； replace indsth = ind * 
south ； 

replace blknth = blk * north ； replace blksth = blk * 
south ； 

replace blkovs = blk * ovsbn ； replace indovs = ind * 
ovsbn ； 

replace blkhe = blk * highed ； 

/* 对每个人对结果 1 ， 2, 3 估计到的概率分别储存为 
pi ， p2 ， p3 * /; 
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predict pi , outcome( 1 ) ; predict p2, outcome(2) ； pre¬ 
dict p3 ， outcome(3) ； summarize pi p2 p3 ； 

/ * 对整个样本概括概率估 计值: 每个人都假定为白人 
( 表 3.5 上部分 ）*/ ; 
drop pi p2 p3 ； 

/* 对每个人对结果 1 ， 2, 3 计算 Z 值并储存于 zl ， Z 2, 
z3 ： 每个人都假定为白人 * 八 

predict zl ， outcome(l) xb ； predict z2, outcome(2) xb ； 
predict z3 ， outcome(3) xb ； 

/* 对整个样本，计算 zl Z 2 Z 3 的均值，并储存于 zml, 
zm2 ， zm3 * /; 

summarize zl, mean ； gen zml = r(mean) ； summarize 
z2 ， mean ； gen zm2 = r(mean) ； summarize z3 ， mean ； gen 
zm3 — r(mean )； 

/* 用方程 3. 12a 和方程 3. 12b 计算结果 1 ， 2, 3 的概 
率 : 每个人都假定为白人 * /; 

gen sum = 1 + exp(zm2) +exp(zm3) ； gen pi = llsum ； 
gen p2 = exp(zm2)/sum ； gen p3 — exp(zm3)/sum ； 

summarize pi p2 p3 ； / * 对整个样本概括概率估 计值： 
每个人都假定为白人 ( 表 3. 5 下部分 ）* /; 

drop zl z2 z3 sum pi p2 p3 zml zm2 zm3 ； / * 因为随后 
还要用到，在此放弃这些变量名 * /; 

replace blk = 1 ； / * 每个人都是黑人 * /; 

/ * 所有涉及 blk 和 ind 的交互变量都需要重新计算 * /; 
replace blknth — blk * north ； replace blksth = blk * 
south ； 
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replace blkovs = blk * ovsbn ； replace blkhe = blk * 
highed ； 

卜 没有必要替换 ind * 变量因为 ind 已经等于0 * / ; 

/* 对每个人对结果1，2, 3估计到的概率分别储存为 
pi ， p 2 ， p 3 * / ； 

Predict pi ， outcome(l) ； predict p2 ， outcome(2) ； pre¬ 
dict p3 ， outcome(3 )； 

summarize pi p 2 p 3 ； drop pi p 2 p 3； / * 对整个样本概 
括概率估 计值: 每个人都假定为黑人(表 3. 5 上部分 ）* /; 

/* 对每个人对结果1，2, 3计算 Z 值并储存于 zl ， z 2, 
z 3： 每个人都假定为黑人 */; 

predict zl ， outcome(l) xb ； predict z2 ， outcome(2) xb ； 
predict z3 ， outcome(3) xb ； 

/* 对整个样本，计算 zl Z 2 z 3 的均值，并储存于 zml ， 
zm 2 ， zm 3 * / ； 

summarize zl, mean ； gen zml = r(mean) ； summarize 
z2 ， mean ； gen zm2 — r(mean) ； summarize z3, mean ； gen 
zm3 = r(mean )； 

/* 用方程 3. 12 a 和方程 3. 12 b 计算结果1，2, 3 的概 
率: 每个人都假定为黑人 * 八 

gen sum = 1 + exp(zm2) + exp(zm3) ； gen pi = 1/ sum ； 
gen p2 — exp(zm2)/sum ； gen p3 — exp(zm3)/sum ； 
summarize pi p2 p3; / * 对整个样本概括概率估 计值： 
每个人 都假定 为黑人 (表 3. 5下部分 ）* /; 

drop zl z2 z3 sum pi p2 p3 zml zm2 zm3 ； / * 因 为随后 
还要用到 ，在此放弃这 些变量名* /; 
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replace ind = 1 ； replace blk = 0; / * 每个人都是印第安 
人 * /; 

/* 所有涉及 blk 和 ind 的交互变量都需要重新计 
算 * /; 

replace indnth = ind * north ； replace indsth = ind * 
south ； 

replace blknth = blk * north ； replace blksth = blk * 
south ； 

replace blkovs=blk * ovsbn ； replace indovs= ind * ovsbn ； 

replace blkhe=blk * highed; 

/* 对每个人对结果1，2, 3 估计到的概率分别储存为 
pi , p 2, p 3 * /； 

predict pi ， outcome(1) ; predict p2 ， outcome(2) ； pre¬ 
dict p3, outcome(3 )； 

summarize pi p 2 p 3 ； drop pi p 2 p 3； / * 对整个样本概 
括概率估计值：每个人都假定为印第安人（表 3. 5 上部 
分 W ; 

/ * 对每个人对结果1，2，3计算 Z 值并储存于 zl , z 2, 
z 3： 每个人都假定为印第安人 */; 

predict zl , outcome(l) xb ； predict z2 ， outcome(2) xb ； 
predict z3, outcome(3) xb ； 

/* 对整个样本，计算 zl z2 Z 3 的均值，并储存于 zml, 
zm2, zm3 * / ； 

summarize zl, mean ； gen zml = r(mean) ； summarize 
z2 ， mean ； gen zm2 = r(mean) ； summarize z3, mean ； gen 
zm3 = r(mean )； 




logit 与 probit : 次序模型和多类别模型 


/* 用方程 3. 12a 和方程 3. 12b 计算结果 1 ， 2, 3 的概 
率 : 每 个人都假定为印第安人 * /; 

gen sum = 1 + exp(zm2) +exp(zm3) ； gen pi = 1/sum ； 
gen p2 = exp(zm2) / sum ； gen p3 = exp(zm3)/sum; 
summarize pi p2 p3 ； / * 对整个样本概括概率估 计值： 
每个人都假定为印第安人表 3. 5下部分 * /; 

drop zl z2 z3 sum pi p2 p3 zml zm2 zm3 ； / * 因为随后 
还 要用到，在此放弃这 些变量名 */; 

replace blk = blko ； replace ind = indo ； / * 恢复原来的 
变量 */; 

/* 程序结束 */ ; 
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注释 


[1 ] 在网站 http：//www. indiana. edu/ 〜 statmath/stat/all./cat/giant. html 
可以找到。 

[2] 只有两种结果时，次序 logit 与 probit 这两种方法都可以使用，不管因 
变量是有序的还是非有序的。 

[3] 但是，有序模型可以基于除 logit 或 probit 分布之外的其他分布。比 
如，对偏斜有序数据 （skewed ordinal data) 的双对数 （ log-log )、 负双对 
数 (negative log-log) 或互补双对数 （complementary log-log) 分布（见 
Agresti ， 1990)。大致要点是，次序 logit 和 probit 模型是一系列更广 
泛得多的处理有序因变量的观点中的一部分。其实，如果结果的数目 
很大（比如，大于20)，那么次序 logit 和 probit 的方法就会变得很笨重， 
用其他方法可能会更合适(关于这点的讨论，见 Rreskog & Sorbom, 
1988:44—45; 1993:1—17)。 

[4] 排序可以基于收入，这种情况下职业具有一个客观的 等级; 或者也可基 
于文化假设和偏见。 

[5] 比“把结果当成是有序的，除非我们有好的理由不强加一个排序”更好。 

[6] 记住， N= N, +IV 2 +JV 3 。 

[7J 因为它们的计算方法，这些估计值被称为最大似然估计值 (maximum 
likelihood estimates) 0 

[8] 还有别的把有序结果模型化的方法，比如相邻类别 （adjacent catego- 
riesMogit 模型，构造型 （stereotype) 模型， logit 模型和连续比 （continu¬ 
ation ratio) logit 模型 (见 Agresti， 1996:216—220)。 

[9] 它非常类似于一个自由度为7的/分布 (Greene， 2000:815>。 

[10] 关于这个属性的讨论见 Bra n t(1990)。 

[11] 其实 Greene (2000) 把它的临界值记为从0开始，所以在它的注释中， 
^ =0。 但为了方便比较，我把他的临界值起点记为1。 

[12] 记住， Greene(2000:876) 把命,写成〆 *r。 

[13] 因为％ = 0,戌 =-恥， 所以 STATA 的第一个临界值是负的截距。 

[14] 均值为0方差为1的正态分布。 

[15] 记住，这三个概率之和必须为1。 

[16] 与其中一个结果相关的系数必须为了可识别性而被标准化。 

[17] 这些人相当于这次人口普査记录的一个2%样本。对这个数据的更完 
整的描述见 Borooah(2000a)。 

[18] 某个人被认为没有被剥夺如果 D, = 0,轻度被剥夺如果0 < A <万， 
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严重被剥夺如果 A >亡，其中万为剥夺指数的均值。 

[19] 另一种标准化，设定17的人 AGE , = 1，18岁的 AG £ ; = 2,等等。 

[20] 这些是通常在18岁或18岁以上获得的文凭。 

[21] 他 们是： Belfast (地区 1) ; Ards , Castlereagh , North Down (地区 2); 
Down , Lisburn (地区 3); Carrickfergus , Lame , Newtwoenabbey (地区 
4); Antrim ♦ Ballymena and Ballymoney (地区 5) ? Armagh « Newry 
Moume (地区 7); Coleraine ， Cookstown , Maghrafelt , Moyle (地区 6); 
Banbridge , Craigavon ， Dungannon (地区 8)； Derry , Limavady (地区 
9); and Fermanagh ， Omagh , Strabane (地区 10)。 因为多重共线性，不 
能10地区全都放在方程 2. 16中。 ( Belfast ) 这个地区从方程中 
去掉了。 

[22] 所有非罗马天主教徒识别为“基督徒”，虽然后者还包括要么没有陈述 
宗教信仰(北爱尔兰居民的 7. 2%)，要么宣称他们没有信仰的人(北爱 
尔兰居民的 3. 8%)。 

[23] 注意， U ) 在 STATA 里，丨=0, （ b ) 从方程 2. 16, dDJdAGE , = /3 4 + 

2 ^AGEi o 

[24] 这些比率表示沃尔德统计量 (Wald statistic ) 的一种形式。 

[25] 为了测量平行斜率假设，这个模型还用多类别 logit 进行了估计，产生 
了一个等于一 12380. 36的似然值(记为 L 2 ) D 由2(匕一 M ) 计算出来 
的值为 86. 4( 与次序 logit 模型进行的比较），依照严格的似然比检验的 
解释，这个值超过了 /(20)的5%临界值 31. 41。但是,正如前面指出 
的， 2 a 2 - L ,) 的值只是提示性的，因为这个统计值并没有提供似然比 
检验的基础。 

[26] 说明 ：（ 表中的）姑 + u =( 文字中的） Z ,_+ e ,.。 

[27] 临界点其实只是模型的系数，且与斜率系数一起用最大似然方法估计 
而得。 

[28] 这些比例在这个章节开头的时候就设定了。 

[29] 虽然当平均数被定义为个人概率的中位数(而不是均值）时结果会不 
一样。 

[30] 注意，在 STATA 中，斤= 0。 

[31] 为了方便表述，随后的讨论全都针对 logit 模型。 

[32] 比如，与8%的新教徒相比，样本中将近16%的天主教徒为单身父/ 
母亲。 

[33] 注意，这些预测到的均值会与天主教徒与新教徒处于不同剥夺程度的 
样本比例相同。 
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[34] 即新教徒的属性用新教徒的系数进行评估。 

[35] 在失业者和退休者的情况下，这些概率几乎不变。 

[36] 在具有相同的处于轻度被剥夺的平均概率的意义上来说。 

[37] 这些人相当于这次人口普査记录的一个2%样本。对这个数据的更完 
整的描述见 Borooah (2000 b ) 0 

[38] 缺省值为没有18岁或18岁以上的文凭。 

[39] 只在这个人具有18岁或18岁以上的文凭时有意义。缺省值为文科类 
课程。 

[40] 缺省值为白人。 

[41] 缺省值为伦敦。 

[42] 关于英国的标准区域划分 ：中英 格兰东 （East Midlands ); 东英格利亚 
(East Anglia ) ;东南部 (the Southeast ) (伦敦除外）；西南部 （the South ¬ 
west ) 0 

[43] 北部; 约克郡 ( Yorkshire ); 中英格兰西 (West Midlands ) ;西北部;威尔 
士 ( Wales ) ;苏格兰 ( Scotland )。 

[44] 注意，这三种结果中的任何一种都可以被选择为基准结果。 

[45] 当然，如果对某个特定组别相关系数为正的，那么它就会享受“种族的 
意外收获”。 

[46] 这些比率表示沃尔德统计量 (Wald statistic ) 的一种形式。 

[47] 除了年 龄:年 龄更大的人更加可能处于更高的职业类别，或者，就方程 
3.14 的估计系数来说，仏>0, j = I ，2。 

[48] 除非有特殊说明相反情况，否则本文的讨论均带有其他条件相同这一 
条件。 

[49] 虽然在 PMT 这个类别上对居住在北部的黑人并不适用。 

[50] 或者说，样本中 41. 5%的所有男性， 41. 8%的白人男性， 29. 3%的黑人 
男性，和 35. 1%的印度男性处于 PMT 职业类别中。 

[51] 通过把方程里面的乏，视情况而定，换 成名 v , , 和艺 

[52] 或者同等地利用样本白人中个人的决定变量 X * 的均值元&进行计算。 

[53] 应该注意的是，这一部分介绍的以模拟为基础的策略是与关于组间结 
果差别相关的一系列具体问题有关的。至于模拟策略的更加概括性的 
方法，请见 Tomz，Wittenberg and King (1999 )。Tom 等人 （1999) 开发 
了一个程序 Clarify ， 这个程序利用随机模拟把原始的统计程序结果转 
换成让研究者直接感兴趣的结果。这个程序是为了在 STATA 中运行 
而设计的。 

[54] 类似的应用也可以在假定样本中每个人都为印度人的情况下实行。 

[55] 其中，％是白人的系数， a r ^ ry r 是印度人的系数。 
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[56] 之 i 是用表 3. 3中所示的估计值联合每个人的决定变量的值计算出来 
的。在方程 3. 14中，当所有人是白人时， IND ^ BLK ^ O , 当所有人 
是黑人时， BLK ,_ = 1。 

[57] 另一方面,如果式 > 式％则 Af >1,存在种族优势。 

[58] 另一方面, 如果彳 > 则< > 1,存在总体获利。 

[59] 这仅仅取决于样本比例的比，而它当然是保持不变的。 

[60] 在多类别模型中，风险比对数仅仅取决于与 j 和6相关的系数(间的差 
别），与任何其他结果的系数无关。 

[61] Domencich and McFadden ( 1996) 0 

[62] 这个不足之处是经济学中许多在经验上方便的函数形式共有的，比如 
柯布一道格拉斯 ( Cobb - Douglas ) 或者不变替代弹性 （ CES )( Constant 
Elasticity of Substitution ) 函数形式。 

[63] 虽然必须强调，新选项的引进可能是对已有选项的 分割： 比如把熟练的 
体力劳动者/非体力劳动者分成熟练的体力劳动者和熟练的非体力劳 
动者两个选项。 

[64] 见先前讨论的如何在引进一个新选项时重新计算概率。 

[65] 在网站 http ：// www . indiana . edu / 〜 statmath / stat / all / cat / giant . html 
可以找到。 
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' 译名对照表 

adjacent categories logit 

相邻类别 bgit (模型） 

base outcome 

“基准”结果 

best linear unbiased estimator(BLUE) 

最优线性无偏估计 

binary choice model 

二分选择模型 

binary model 

二分模型 

categorical variable 

类别变量 

Cobb-Douglas 

柯布一道格拉斯(函数形式) 

complementary log-log distribution 

互补双对数分布 

Constant Elasticity of Substitution(CES) 

不变替代弹性(函数形式) 

continuation ratio logit model 

连续比 logit 模型 

critical value 

临界值 

Cross-Price Elasticity of Demand 

需求的交叉弹性 

cumulative probability distribution 

累积概率分布 

cutoff parameter 

临界参数 

degree of freedom 

自由度 

discrete dependent variable 

离散因变量 

dummy variable 

虚拟变量 

error term 

误差项 

estimate 

估计值 

estimation 

估计 

explanatory power 

解释力 

generalized logit model 

广义 logit 模型 

goodness of fit test 

拟合优度检验 

Independence of Irrelevant AltemativesdlA) 

无关选项独立性 

Independently and Identically Ostributed(IID) 

独立同分布 

individual observations 

个体观测值 

interaction effect 

交互作用 

interaction variables 

交互变量 

intercept term 

截距项 

latent regression 

潜在回归 

latent variable 

潜在变量 
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likelihood ratio 

似然比 

likelihood-ratio test 

似然比检验 

linear function 

线性函数 

log likelihood function 

对数似然函数 

logistically distributed 

逻辑分布 

log-log distribution 

双对数分布 

marginal effect 

边际效应 

maximum likelihood estimates 

最大似然估计值 

model specificaitn 

模型设定 

multinomial distribution 

多项分布 

multinomial logit/probit 

多类别 logit/probit 

multinormal integration 

多重正态积分 

multiple outcome model 

多元结果模型 

negative log-log distribution 

负双对数分布 

nonscalar covariance matrix 

非纯量协方差矩阵 

normally distributed 

正态分布 

null hypothesis 

零假设 

odds ratio 

比数比 

ordered logit/probit 

次序 logit/probit 

ordinal outcomes 

有序的结果 

ordinal dependent variable 

有序因变量 

Ordinary Least Squares(01^) 

普通最小二乘法 

parallel slopes cumulative model 

平行斜率累积模型 

parallel slopes 

平行斜率 

parameter 

参数 

perfect prediction 

理想预测 

probability density function 

概率密度函数 

proportional-odds model 

比例比数模型 

qualitative choice model 

定性选择模型 

random utility model 

随机效用模型 

risk-ratio 

风险比 

sample statistics 

样本统计量 



译名对照表 


simulation 

模拟 

skewed ordinal data 

偏斜有序数据 

standard normal variate ( SNV ) 

标准正态变量 

stereotype model 

构造型模型 

subsample 

子样本 

threshold values 

临界值 

unbalanced sample 

不平衡样本 

utility maximization 

效用最大化 

Wald statistic 

沃尔德统计量 

Weibull distribution 

威布尔分布函数 



